Fiabilité, disponibilité et facilité de service (RAS)

Lors de la conception, de la fabrication ou de l'achat d'un composant ou d'un produit pour l'ordinateur, la fiabilité, la disponibilité et la facilité de service (RAS) sont autant d'attributs à prendre en considération. Ce terme a été utilisé pour la première fois par IBM pour définir les spécifications de ses ordinateurs centraux et ne s'appliquait à l'origine qu'au matériel. Aujourd'hui, la RAS concerne également les logiciels et peut s'appliquer aux réseaux, aux programmes d'application, aux systèmes d'exploitation (OS), aux ordinateurs personnels (PC), aux serveurs et aux superordinateurs. La fiabilité désigne la capacité des composants matériels et logiciels d'un ordinateur à fonctionner de manière constante conformément à leurs spécifications. En théorie, un produit fiable est totalement exempt d'erreurs techniques. Les fournisseurs expriment souvent la fiabilité de leurs produits en termes de pourcentage. L'Institute of Electrical and Electronics Engineers (IEEE) parraine une organisation consacrée à la fiabilité dans l'ingénierie, connue sous le nom de IEEE Reliability Society (IEEE RS). La disponibilité est le rapport entre le temps pendant lequel un système ou un composant est fonctionnel et le temps total pendant lequel il doit ou devrait fonctionner. Elle peut être exprimée en proportion directe (par exemple, 9/10 ou 0,9) ou en pourcentage (par exemple, 90%). Elle peut également être exprimée en termes de temps d'arrêt moyen par semaine, mois ou année ou en temps d'arrêt total pour une semaine, un mois ou une année donnés. La disponibilité de certains systèmes est exprimée en termes qualitatifs. Elle indique dans quelle mesure le système est capable de continuer à fonctionner lorsqu'un ou plusieurs de ses composants importants tombent en panne. La facilité d'entretien est l'expression de la facilité avec laquelle un composant, un dispositif ou un système peut être entretenu et réparé. La détection précoce des problèmes potentiels est essentielle à cet égard. Certains systèmes peuvent corriger automatiquement les problèmes potentiels avant qu'ils ne deviennent graves. C'est le cas par exemple de l'antivirus et des logiciels espions intégrés de Microsoft Windows XP, ainsi que des logiciels antivirus auto-protégés. Idéalement, les opérations de maintenance et de réparation devraient provoquer le moins de temps d'arrêt ou de perturbation possible. Ce sont là quelques-uns des éléments les plus importants de la RAS : La suringénierie, qui consiste à concevoir des systèmes dont les spécifications sont supérieures aux exigences minimales. La duplication, c'est-à-dire l'utilisation intensive de systèmes et de composants redondants. La récupération est obtenue en utilisant des techniques d'ingénierie tolérantes aux pannes. La mise à jour automatisée est un moyen de maintenir les systèmes d'exploitation et les applications à jour, sans que l'utilisateur ait à intervenir. La sauvegarde des données, pour éviter toute perte catastrophique. L'archivage des données, qui permet de conserver des enregistrements complets des données en cas d'audit ou d'autres besoins de récupération. Le remplacement à chaud, c'est-à-dire la possibilité de remplacer à chaud des composants ou des périphériques. Les machines virtuelles sont utilisées pour minimiser les effets des erreurs de système d'exploitation et de logiciel. Les suppresseurs de surtension sont utilisés pour minimiser les dommages aux composants dus aux anomalies des lignes électriques. L'alimentation continue est une alimentation sans interruption qui permet aux systèmes de fonctionner tout en passant de l'alimentation commerciale à l'alimentation de secours. Les sources d'alimentation de secours, qui comprennent les batteries et les générateurs, permettent de maintenir les systèmes opérationnels pendant les interruptions prolongées de l'alimentation commerciale.

Vous pouvez également être intéressé
  1. Serveur d’accès distant (ras) Définition - Que signifie le serveur d'accès distant (RAS)? Un serveur d'accès à distance (RAS) est un type de serveur qui fournit une suite de services aux utilisateurs connectés à distance via un réseau ou Internet. Il fonctionne comme une passerelle distante ou un serveur central qui connecte les utilisateurs...
  2. Ingénierie de fiabilité de site (sre) Définition - Que signifie l'ingénierie de fiabilité du site (SRE)? L'ingénierie de fiabilité du site (SRE) est une approche des opérations de site Web qui utilise des techniques d'ingénierie logicielle pour créer des sites Web plus fiables. L'ingénierie de fiabilité de site a été développée pour la première fois chez...