Ingénierie de fiabilité de site (sre)

Définition - Que signifie l'ingénierie de fiabilité du site (SRE)?

L'ingénierie de fiabilité du site (SRE) est une approche des opérations de site Web qui utilise des techniques d'ingénierie logicielle pour créer des sites Web plus fiables. L'ingénierie de fiabilité de site a été développée pour la première fois chez Google en 2003. Le terme est lié à DevOps, qui combine également l'ingénierie logicielle et l'administration système, mais DevOps implique l'automatisation des tâches manuelles.

Definir Tech explique l'ingénierie de fiabilité du site (SRE)

L'ingénierie de la fiabilité des sites implique l'utilisation de techniques d'ingénierie logicielle, y compris des algorithmes, des structures de données, des performances et des langages de programmation pour réaliser des applications Web hautement fiables. L'approche a été développée pour la première fois chez Google en 2003.

Dans une interview, le vice-président de l'ingénierie de Google, Ben Traynor, a déclaré que la société avait embauché 50 à 50 personnes ayant une expérience à la fois en génie logiciel et en administration système pour ses équipes SRE. Google affecte de petites équipes SRE à des projets majeurs. Traynor a attribué le temps de fonctionnement remarquable de Google à l'automatisation de nombreuses activités d'exploitation du site. Bien que les échecs se produisent occasionnellement, ils sont corrigés rapidement car l'équipe SRE a automatisé de nombreuses tâches au préalable.

Google s'est également inspiré des jeux de rôle en organisant des exercices de préparation opérationnelle pour tester les ingénieurs en cas de pannes nécessitant une automatisation. L'entreprise appelle ces exercices «Wheel of Misfortune», où un employé joue le rôle du système et un autre joue le rôle de l'ingénieur de garde. Traynor a déclaré que cette approche incitait les ingénieurs à penser à la fiabilité plus que les foreuses conventionnelles.

SRE est similaire à DevOps, mais ce dernier se concentre sur l'automatisation du déploiement des systèmes en général, tandis que SRE se concentre spécifiquement sur la fiabilité.