16/12/2024

DSI Experience

Bien appréhender la Supervision… Partie 1

Devant la multiplication des services que fournit une DSI et face à la multiplication des serveurs (physiques et virtuels) la mise en place d'un outil de supervision est un passage obligé. Nos utilisateurs sont également de plus en gourmands, tant en service qu'en volumétrie des données qu'ils traitent, ils ne supportent plus (ou de moins en moins bien) les imperfections de nos « systèmes »…

La DSI se doit donc de piloter son système d'information afin de détecter la moindre anomalie avant l'utilisateur – c'est bien de cela qu'il s'agit quand on parle de supervision aujourd'hui – et afin de prévoir les évolutions de son infrastructure sans être mis devant le fait accompli !

Pour autant, j'ai vu bon nombre d'organisations s'extasier devant un mur (un grand écran…) rempli de petits voyants (plutôt rouges que verts d'ailleurs…) ou bien encore, être fières d'avoir envoyé plus de 100 mails aux techniciens, dans un même journée, mails relatant des "incidents" qui n'en sont pas vraiment ou des alarmes qui ne sont pas si critiques que cela… Bref, la mise en place d'un outil de supervision ne s'improvise pas !

Depuis quelques années, des solutions open-source sont apparues et cela a permis à bon nombre de DSI de s'y mettre, premièrement parce que l'on pouvait tester tranquillement une solution sans être harcelé par un commercial (un fournisseur) et, deuxièmement parce que le ticket d'entrée était abordable dans le sens où il ne fallait que quelques jours pour déployer une solution et un peu d'huile de coude…

Il n'y a pas non plus de bonnes ou de mauvaises solutions de supervision, il faut juste trouver celle qui vous convient et qui convient à votre organisation...en se posant tout simplement une série de questions qui vous permettront de mieux savoir à quelle porte frapper, par exemple :

  • Avez-vous la maîtrise totale de vos serveurs et équipements ?
  • Vos serveurs et équipements sont-ils hébergés (tout ou partie) chez un hébergeur ?
  • Etes-vous multi-sites, sur plusieurs fuseaux horaires ?
  • Délivrez-vous des services H24 et 7 jours sur 7 ?
  • Combien de personnes sont en charge de l'administration de vos systèmes ?
  • Quelles sont les technologies que vous utilisez (virtualisation ? SAN ? OS ? Produits/Progiciels ?...)
  • Allez-vous maintenir vous même votre solution de supervision ?
  • Quel niveau d'intégration souhaitez-vous atteindre avec votre solution de supervision ? Souhaitez-vous un couplage avec votre solution de ticketting, d'inventaire ou bien de déploiement ?
  • Quel est le point le plus faible de votre infrastructure aujourd'hui ? Les réseaux ? Les systèmes ? Le Stockage ? Les applications ?

Voilà, le décor est planté et si vous répondez correctement à toutes ces questions, vous devriez obtenir une bonne synthèse qui doit vous permettre de vous orienter vers un produit plutôt qu'un autre...ou d'orienter votre supervision existante vers ce dont vous avez réellement besoin !

Entrons maintenant dans le détail des fonctionnalités qui pourraient composer un bon outil de supervision… Ce pourrait être également une introduction à votre expression de besoin quant à votre recherche d'un outil de supervision... On ne parlera pas de technique ici mais juste du "fonctionnel"…

Les ingrédients nécessaires :

  1. Un gestionnaire de comptes utilisateurs pour se connecter aux systèmes à superviser
  2. Un gestionnaire d'opérateurs pour gérer les utilisateurs de la solution
  3. Une notion de "réseaux" ou d'entités pour regrouper les objets (systèmes à surveiller) entre eux
  4. Un gestionnaire de "vues" pour afficher aux utilisateurs les données qui les concernent avec plus ou moins de détails selon leur degré de responsabilité ou d'implication
  5. Un gestionnaire d'actions à réaliser suite à une alarme (ex. relancer un service, supprimer un fichier, lancer une commande, envoyer un SMS...)
  6. Un calendrier d'événements (pour les maintenances ou actions programmées ou pour les absences des opérateurs...)
  7. Les objets à superviser (un objet équivaut à un "système" à superviser, au sens large du terme)
  8. Les sondes ou moniteurs (le cœur des fonctionnalités)
  9. Un outil de reporting (un minimum s'impose...)

1/ Pourquoi un gestionnaire de « comptes » ?

En fait je suis plutôt contre les solutions qui utilisent un agent que l'on doit déployer sur les systèmes à superviser, il s'agit en effet d'un maillon faible et lourd à maintenir… C'est pourquoi on a besoin de gérer une "banque de comptes", comptes utilisateurs (avec un certain niveau de droits) qui permettront de se connecter aux différents systèmes que l'on souhaite superviser et de récupérer les métriques (les valeurs) qui nous intéressent...

2/ Un gestionnaire d'opérateurs

Les opérateurs ou utilisateurs de la solution peuvent être répartis dans des groupes avec plus ou moins de droits. Ces droits doivent non seulement être liés aux fonctionnalités de l'outil de supervision mais aussi aux systèmes dont cet opérateur aura accès. Exemples :

  • l'opérateur A ne dispose que de fonctionnalités lui permettant de visualiser l'état des sondes (des moniteurs) sur un réseau (au sens propre du terme) ou sur une entité (tous les systèmes dédiés à la filiale de Madrid par exemple),
  • l'opérateur B peut acquitter une alarme mais ne peut pas en changer les propriétés,
  • l'opérateur C peut changer les propriétés des sondes (les seuils d'alarme par exemple) mais uniquement sur l'entité Y
  • l'opérateur D peut créer de nouveaux moniteurs, voire de nouveaux objets à superviser,
  • l'opérateur E peut accéder au gestionnaire de comptes…

etc...

3/ Une notion de « réseaux » ou d'entités

En fonction de la taille de votre organisation, vous aurez sans doute besoin de « cloisonner » l'accès aux systèmes supervisés, ou tout simplement d'organiser vos systèmes en groupes afin de rendre le tout plus « lisible », exemples :

  • tous les systèmes situés dans un réseau déterminé (ex. 172.16.192.0/24)
  • tous les systèmes situés sur un site donné (cas d'une entreprise ayant plusieurs sites)
  • tous les systèmes liés à un métier donné (les systèmes délivrant des services dédiés à l'administration et les finances)
  • tous les systèmes liés à l'infrastructure « Réseau » ou l'infrastructure « Stockage »
  • etc.

4/ Un gestionnaire de « Vues »

Il s'agit là d'un point très important et souvent sous-estimé dans les solutions de supervision que je connais. En clair l'outil de supervision doit pouvoir proposer différentes formes d'affichages concernant le bilan de santé de votre S.I c'est à dire différentes manières de visualiser l'état des voyants car, quand on parle de tableau de bord on parle bien de petites loupiotes vertes, oranges, rouges et plus dans certains cas… L'objectif est de pouvoir obtenir des vues très globales ou très détaillées ou bien encore dédiées à un « service » ou un client en particulier.

Il est donc nécessaire de pouvoir afficher différentes vues telles que :

- une vue par « réseaux » ou par « entités » comme représentée ci-dessous

Météo du S.I des filiales

Filiale d'Athènes

Filiale de Barcelone

Filiale de Madrid

Filiale de Rome

 Filiale de Stuttgart

Siège de Paris

…/…

ou bien une vue par « clients »...

Météo du S.I des Clients

 Client A

Client B

Client C

…/…

ou bien une vue dédiée à un client ou une entité particulière...

Météo des Services du Client DUPONT

 Service A (un site web par exemple)

 Service B (une base de données par exemple)

 Service C (une application par exemple)

 Service D (un équipement réseau par exemple)

…/…

puis on peut également dédier une vue à un certain type de moniteur…

Météo des Salles Serveurs

 Température & Hygrométrie Salle A

Température & Hygrométrie Salle B

 Température & Hygrométrie Salle C

…/…

ou à des objets en particulier…

Météo des Firewalls & Proxies

 Firewall A

 Firewall B

Proxy A

 Proxy B

...là aussi...

Serveurs PostgreSQL

 Serveur A

Serveur B

 Serveur C

Serveur D

...pour arriver aux informations détaillées comme un serveur par exemple...

Météo du Serveur D

 CPU

Mémoire (avertissement – état précédent celui d'alerte)

 Interface Réseau #1

Interface Réseau #2

 I/O Disque #1

I/O Disque #2

Service 1 (en alerte)

Service 2

Service 3 (en maintenance)

Stockage 1

█ Stockage 2 (désactivé)

Fonction #1

Fonction #2

Fonction #3

…/...

...et enfin pouvoir placer soi-même ces objets sur un fond graphique (une carte, un schéma, une photo...afin d'obtenir une vision plus « marketing » de la chose…supervision-DSI-02
supervision-DSI-01

author avatar
LeCastillan
D.S.I autodidacte d'une E.T.I (Entreprise de Taille Intermédiaire) de 400 personnes ayant une activité internationale 24/7 - Passionné - Aime écrire - Aime les choses "simples" - Aime la Liberté - Aime l'Open Source - Curieux - Pragmatique...
Partagez cet article Partager sur Twitter Partager sur Facebook Partager sur Linkedin Envoyer par mail

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.