Ingénieur en fiabilité de site

L'ingénieur en fiabilité de site est le titre d'emploi d'un développeur de logiciels qui contribue à garantir la prévisibilité, l'évolutivité et la stabilité des systèmes informatiques d'une organisation. Ce poste requiert une personne à l'aise à la fois avec le génie logiciel et les opérations informatiques. Le terme SRE a été inventé chez Google vers 2003, lorsque l'entreprise a embauché Ben Treynor Sloss pour diriger une équipe d'ingénieurs logiciels chargés de gérer un environnement de production. L'entreprise devait créer de nouveaux paradigmes pour gérer ses grands systèmes, tout en introduisant continuellement de nouvelles fonctionnalités et une expérience utilisateur final (UX) de haute qualité.

L'ingénierie de la fiabilité des sites était traditionnellement réalisée par les équipes d'exploitation. Cependant, les SRE utilisent aujourd'hui l'apprentissage automatique (ML) pour des tâches qui étaient auparavant automatisées par des humains. En général, les SRE sont chargés de sélectionner les outils d'infrastructure, de gérer les changements de production et de déterminer les interventions d'urgence. Les SRE consacrent généralement jusqu'à 50 % de leur temps aux responsabilités opérationnelles (y compris les problèmes, les appels et les interventions manuelles) et le reste de leur temps aux tâches de codage et d'automatisation. Toutefois, ces pourcentages et les tâches des SRE peuvent varier, en fonction des modèles d'entreprise et de la culture spécifiques. Compétences de l'ingénieur en fiabilité de site Les SRE sont désormais plus importants que le poste traditionnel d'administrateur système (sysadmin). Les compétences requises pour les SRE comprennent une licence en informatique ou dans un domaine connexe, ainsi qu'une expérience de niveau production dans au moins un langage de code écrit en interface de ligne de commande de haut niveau (comme Java, C/C++ et Go) et au moins un langage dynamique (notamment Ruby, Python et Node.js). Une expérience avancée peut être requise en matière de réseaux, d'administration Linux/Unix et de programmation de systèmes. Les employeurs cherchent également à recruter des membres de l'équipe SRE ayant de l'expérience dans l'analyse axée sur les données et l'infrastructure en tant que code (IaC), ainsi que dans les grappes de serveurs, l'équilibrage des charges et la surveillance. D'autres compétences SRE souhaitables sont l'expérience avec au moins un grand fournisseur de cloud et une technologie de conteneur. Les compétences non techniques, telles que la communication et l'écoute, constituent un atout supplémentaire. Ingénierie de la fiabilité des sites vs. DevOps L'ingénierie de la fiabilité des sites et DevOps ont des objectifs similaires : maintenir une équipe aux compétences variées impliquée dans le développement de logiciels, de la conception à l'exploitation, automatiser les tâches répétitives et utiliser des outils d'ingénierie dans les opérations. DevOps peut être appliqué à des postes informatiques et non informatiques, mais le SRE se concentre uniquement sur le soutien des opérations informatiques pendant le processus de développement des logiciels et leur déploiement en production. DevOps est souvent dirigé par des chefs d'entreprise, mais ceux-ci participent rarement au SRE.

Vous pouvez également être intéressé
  1. Ingénierie de fiabilité de site (sre) Définition - Que signifie l'ingénierie de fiabilité du site (SRE)? L'ingénierie de fiabilité du site (SRE) est une approche des opérations de site Web qui utilise des techniques d'ingénierie logicielle pour créer des sites Web plus fiables. L'ingénierie de fiabilité de site a été développée pour la première fois chez...
  2. Site de reprise après sinistre (site dr) Définition - Que signifie le site de reprise après sinistre (site DR)? Un site de reprise après sinistre (site DR) est une installation de sauvegarde alternative, généralement de nature informatique, qui est utilisée lorsqu'un emplacement principal devient inutilisable en raison d'une panne ou d'un sinistre. Il contient des équipements et...

  1. VPN de site à site Définition - Que signifie VPN de site à site? Le VPN de site à site est un type de connexion VPN qui est créé entre deux emplacements distincts. Il permet de connecter des sites ou des réseaux géographiquement séparés, généralement via la connexion Internet publique ou une connexion WAN. Definir...
  2. Planification des ressources d’entreprise sur site (ERP sur site) Définition - Que signifie la planification des ressources d'entreprise sur site (ERP sur site)? La planification des ressources d'entreprise sur site (ERP sur site) fait référence à la décision d'une entreprise de se procurer un logiciel ERP en interne et de le maintenir dans un bureau physique, plutôt que de...