ENGIE est un leader mondial de l’énergie qui construit ses activités autour d’un modèle de croissance responsable pour relever les défis de la transition énergétique. Nous apportons aux particuliers, aux villes et aux entreprises des solutions innovantes basées sur notre expertise dans 4 secteurs clés : la production indépendante d’électricité, le gaz naturel, les énergies renouvelables et les services d’efficacité énergétique à faible…
Résumé du poste :
- Nous recherchons un administrateur système/ingénieur en fiabilité de site (SRE) talentueux et expérimenté pour rejoindre notre équipe dynamique.
- En tant que SRE, vous jouerez un rôle crucial pour assurer la fiabilité, l’évolutivité et la performance de nos systèmes et services.
- Vous collaborerez avec des équipes interfonctionnelles pour mettre en œuvre et maintenir des solutions d’infrastructure robustes, en vous concentrant sur l’automatisation, la surveillance et la réponse aux incidents.
- Le candidat idéal est passionné par l’optimisation et l’amélioration de la fiabilité des systèmes, possède de solides compétences en résolution de problèmes et s’engage à favoriser l’excellence dans les pratiques opérationnelles.
Principales responsabilités:
Automatisation des infrastructures :
- Développer et maintenir des outils et des scripts d’automatisation pour le provisionnement, la configuration et le déploiement.
- Mettre en œuvre des pratiques d’infrastructure en tant que code (IaC) pour garantir la cohérence et la reproductibilité.
Surveillance et réponse aux incidents :
- Mettre en place et maintenir des systèmes de surveillance pour détecter et répondre aux problèmes de performances et aux pannes.
- Participer aux rotations de garde et répondre rapidement aux incidents, dépanner et mettre en œuvre des solutions pour éviter toute répétition.
Optimisation des performances :
- Optimisez les performances du système grâce à une analyse et un réglage continus.
Ingénierie de la fiabilité:
- Mettez en œuvre les meilleures pratiques en matière de fiabilité, telles que la budgétisation des erreurs, les SLI/SLO et les post-mortems irréprochables.
- Travaillez à minimiser les interventions manuelles grâce à l’automatisation.
L’administration du système:
- Gérer et maintenir l’infrastructure du serveur, y compris l’installation, la configuration et le dépannage des systèmes d’exploitation.
- Mettre en œuvre et maintenir des mesures de sécurité, telles que des pare-feu et des systèmes de détection d’intrusion.
- Effectuez régulièrement des sauvegardes du système et des procédures de récupération.
Collaboration et communication :
- Collaborer avec des équipes interfonctionnelles pour aligner les exigences d’infrastructure et opérationnelles.
- Fournir des conseils techniques et un soutien aux collègues dans les domaines liés à la fiabilité.
Qualifications:
- Baccalauréat en informatique, en technologies de l’information ou dans un domaine connexe.
- Expérience avérée en tant qu’ingénieur en fiabilité de site ou administrateur système.
- Solides compétences en script Linux et Bash.
- Maîtrise des plateformes cloud (par exemple, AWS, Azure, GCP, Linode, DigitalOcean).
- Expérience avec les outils d’orchestration de conteneurs (par exemple, Kubernetes, Docker, LXD).
- Connaissance approfondie des réseaux, de la sécurité et de l’administration système.
- Familiarité avec les outils d’infrastructure en tant que code (par exemple, Terraform, Ansible).
- Excellentes compétences en résolution de problèmes et en dépannage.
- Solides compétences en communication et en collaboration.
Qualifications préférées :
- Expérience avec les pipelines CI/CD et les outils associés.
- Connaissance des systèmes distribués et de l’architecture des microservices.
- Familiarité avec les outils d’observabilité (par exemple, Prometheus, Grafana, pile ELK).
- Familiarité avec les langages de programmation (par exemple, Python, Ruby).
Postulez ici
Retrouvez d’autres offres sur notre chaîne Telegram en cliquant ici.