Tolérance aux pannes

Définition - Que signifie la tolérance aux pannes?

La tolérance aux pannes est la manière dont un système d'exploitation (SE) répond à une défaillance matérielle ou logicielle. Le terme fait essentiellement référence à la capacité d'un système à tenir compte des pannes ou des dysfonctionnements, et cette capacité peut être fournie par le logiciel, le matériel ou une combinaison des deux. Pour gérer les pannes avec élégance, certains systèmes informatiques ont deux ou plusieurs systèmes en double.

Definir Tech explique la tolérance aux pannes

Un logiciel de tolérance aux pannes peut faire partie de l'interface du système d'exploitation, permettant au programmeur de vérifier les données critiques à des points spécifiques au cours d'une transaction.

La tolérance aux pannes peut inclure:

  • Répondre à une panne de courant (le plus bas niveau de tolérance aux pannes)
  • Utilisation immédiate d'un système de sauvegarde en cas de panne du système
  • Permettre aux disques en miroir de prendre immédiatement le relais d'un disque défaillant
  • Plusieurs processeurs travaillant ensemble et comparant les données et la sortie pour les erreurs, puis corrigeant immédiatement les erreurs détectées.

En général, une tolérance aux pannes de 100% ne peut jamais être atteinte en raison de contraintes de coût.