Interview d'Experte !

Interview d'Experte !

17 janvier 2023

Hello Chayma, tu es Monitoring Engineer depuis 2 ans dans notre team, qu’est-ce qui t’a amené à évoluer dans le domaine de la supervision IT ?

Je suis diplômée d’un Master of Science – Computer Science Engineering et c’est dans le cadre de mon stage de fin d’études que j’ai pu découvrir la supervision informatique et appréhender ses outils.

La supervision informatique couvre l’ensemble des SI, du Cloud jusqu’à l’Edge (bordure de réseaux), en incluant les équipements On-premise. Elle permet une vue complète des activités métiers, depuis les couches basses des infrastructures jusqu’aux couches applicatives, incluant l’expérience utilisateur et l’expérience client. Ayant un goût prononcé pour l’analyse et la résolution des problèmes, ce domaine m’a passionné.

La supervision informatique fournit une source de données riches et diverses qui ne demande qu’à être partagée et exploitée. Ce stage a été déterminant pour moi et j’ai souhaité orienter mon parcours professionnel vers ces expertises.

Peux-tu nous en dire plus sur ta mission actuelle ?

Depuis 2021, je suis consultante métrologie chez un acteur majeur du secteur bancaire. A mon arrivée je travaillais dans un contexte de migration de la suite CA vers Zabbix* et Grafana*. Ma première mission consistait à réaliser le changement de l’outil de supervision et du dashboarding, sans perte de la supervision des équipements, tout en réalisant l’amélioration de l’existant. Plus d’une centaines de dashboards ont été créés à cette occasion. Suite à la réussite de cette migration vers ces outils, on m’a confié d’autres projets comme par exemple la migration du SNMPv2 vers le SNMPv3.

Selon toi, quel est le rôle des outils de supervision ?

Pour moi, les outils de supervision ont la capacité de réaliser des contrôles de base jusqu’à des contrôles avancés permettant d’examiner à une échelle granulaire les performances d’un produit. Ils sont capables de superviser en temps réel une infrastructure IT et même d’automatiser les corrections en cas de suspicion de problème en exécutant les bonnes actions.

Comment ton travail s’inscrit-il dans la performance business de ton client ?

Au sein de l’équipe Télécom, mon travail contribue à la détection et l’anticipation des incidents ainsi qu’au maintien en condition opérationnelle des infrastructures réseaux. L’infrastructure est désormais observable grâce à Grafana, car elle permet de se connecter à plusieurs sources de données. La supervision établie un lien entre les performances des infrastructures et les résultats métiers qu’elle contribue à générer. Mon travail consiste à m’assurer du bon fonctionnement des applications utilisées au niveau international par des utilisateurs internes ou externes.

Quelles sont tes activités principales ?

Dans un premier temps, je dirais la création de modèles. Avec mon équipe, nous créons les modèles qui sont un ensemble d’entités pouvant être facilement appliqués à plusieurs hôtes. Ils sont la base pour la collecte de certains types de métriques. Ceci ne représente que 1% de notre travail mais indispensable à mes actions.
Dans un second temps, nous sommes garants de la santé de l’infrastructure réseaux et de la mise en place des bons déclencheurs d’alertes en cas de problème. L’objectif ? Avertir les autres équipes et anticiper de sérieux incidents comme l’isolation d’un site.
Enfin, je crée des dashboards sur Grafana, afin de transformer les données issues de plusieurs sources comme Zabbix, Netprofiler… en graphes. Je centralise ainsi les données (métriques, flux, traces) dans un même Dashboard afin de permettre au client de trouver l’information qu’il recherche. Je rends ainsi la lecture des informations plus simple et plus rapide.

Qu’est ce qui te plaît le plus dans ton métier ?

J’ai eu l’opportunité de travailler sur deux missions différentes chez le même client, car l’infrastructure que je supervise est très riche et ne cesse d’évoluer. Ce contexte nécessite l’intégration continue de nouvelles technologies. De plus, les besoins du client sont souvent complexes, ce qui m’oblige à relever des défis et à me surpasser quotidiennement. Je suis également contente de travailler au sein d’une équipe très sympa et soudée : cela facilite l’échange, la communication et le transfert des compétences.

Quelle est ta vision de l’observabilité ?

Pour moi, l’observabilité c’est le fait de récupérer les différents types de métriques et de les stocker dans un outil spécifique afin de les analyser et les exploiter pour fournir une compréhension globale du système. La supervision et l’observabilité sont complémentaires. Pour être rendue possible, l’observabilité nécessite une bonne stratégie de supervision pour la simple raison que la supervision informatique participe à rendre l’entreprise observable, à travers la collecte et l’agrégation de données dans des environnements aujourd’hui fortement distribués. Actuellement je travaille sur la supervision de l’infrastructure réseaux mais l’observabilité va plus loin. Tout est observable, on peut superviser le cloud via l’outil de supervision Prometheus pour ensuite envoyer les données vers des outils d’observabilité par exemple.

Un motto professionnel ?

Be brave, take a risk !

Merci Chayma pour ce retour d’expérience enrichissant. Nous sommes fiers de nos équipes et de ton parcours. Nous savons que tu es armée et capable d’aborder les prochaines évolutions comme l’IAOPS et le SRE !

 

* ZABBIX est un logiciel permettant de surveiller l’état de divers services réseau, serveurs, applications, services, Cloud…  Il produit des graphiques dynamiques de consommation des ressources.
* Grafana est un logiciel qui permet la visualisation de données. Il permet de réaliser des tableaux de bord et des graphiques depuis plusieurs sources dont des bases de données temporelles comme Graphite, InfluxDB et OpenTSDB.