Supervision des
équipements informatiques
Elmoukhtar Ebi Elmaaly
2
Plan
I. Introduction
II. Supervision
III. Standards
IV. Fonctionnement
V. Commandes SNMP
VI. Evolution SNMP
[Link] SNMP
[Link] de Configuration (Agent SNMP)
IX. Solutions
3 I- Introduction
L’administration de réseaux peut s’avérer un
travail complexe.
Un outil de gestion -capable de dialoguer avec
tous les éléments du réseau- est ainsi
indispensable pour exercer cette fonction.
On a donc développé un certain nombre
d’outils, basés sur des protocoles spécifiques tel
que SNMP ou CMIP.
4
II- Supervision
Fonction qui consiste à indiquer et à commander l’état
d’un système, d’un appel ou d’un réseau. Les solutions
de supervision permettent de remonter des
informations techniques et fonctionnelles du système
d’information.
Le terme superviser inclut plusieurs activités:
Surveiller
Visualiser
Analyser
Alerter
Agir
5
II- Supervision
Superviser: quoi?
Le réseau et ses équipements
Les serveurs
Les périphériques
Les applications
La disponibilité des services
Les anomalies (sécurité, système)
Les workflow
6
II- Supervision
Superviser: pourquoi?
L’informatique est au cœur de l’entreprise et doit
fonctionner pleinement et en permanence pour
garantir l’activité
Une indisponibilité du système d’information peut
être la cause de plusieurs millions de pertes
Deux phases sont importantes: garantir la
disponibilité du système mais aussi garantir une
remontée d’information rapide et une durée
d’intervention minimale : c’est le rôle de la
supervision
7
II- Supervision
Superviser: comment?
Il existe deux méthodes pour superviser un système
d’information :
Analyser les fichiers de log
Récupérer des résultats de commandes et de scripts
locaux ou distants
8
III- Standards
Le monde de la supervision et du management des
infrastructures en général possèdent ses normes et
standards. Ces standards sont pour la plupart gérés
par la DMTF (Distributed Management Task Force,
[Link]).
SNMP (Simple Network Management Protocol) est
actuellement le protocole le plus utilisé pour la
gestion des équipements de réseaux.
Il est conçu à l’initiative de CISCO, HP et Sun, puis
normalisé par l’IETF (Internet Engineering Task Force)
et l’OSI.
IV- Fonctionnement
9 SNMP (Simple Network Management Protocol)
Il permet de gérer les équipements du réseau, superviser
et de diagnostiquer des problèmes réseaux et matériels à
distance
Spécifié en 1988 par l’IETF (RFC1157)
Standard actuel pour la supervision TCP/IP
Gère les échanges entre le superviseur et l’agent de
supervision
Utilise le protocole de transport UDP
Transporte les données de supervision (état de
mémoire, CPU, température, état du service HTTP,
etc…) sous forme de variables
IV- Fonctionnement
10
SNMP (Simple Network Management Protocol)
IV- Fonctionnement
11
SNMP (Simple Network Management Protocol)
Il permet de gérer les équipements du réseau, superviser
et de diagnostiquer des problèmes réseaux et matériels à
distance
Equipements managés
Les agents
Les systèmes de
management de réseau
IV- Fonctionnement
12
o Agent SNMP : implémenté sur l’équipement à
superviser. Il gère l’ensemble des informations relatives
à son équipement et il reste à l’écoute des requêtes
envoyés par l’administrateur
o Manager SNMP : c’est la station de supervision du
réseau où toutes les informations reçues sont
centralisées
IV- Fonctionnement
13
o La base de données MIB (Management Information
base) : est la base de données des informations de
gestion maintenue par l’agent, auprès de laquelle le
manager va venir pour s’informer. Un fichier MIB est un
document texte écrit en langage ASN (Abstract
Syntax Notation) qui décrit les variables, les tables et
les alarmes gérées au sein d’une MIB.
V- Commandes SNMP
14
Messages SNMP
Requêtes (port 161, Superviseur vers Agent)
Permet de demander ou de modifier une ou
plusieurs variables
Réponses (port 161, Agent vers Superviseur)
Permet de répondre à une requête
Alarmes (port 162, Agent vers Superviseur)
Envoyées au superviseur au cas d’un problème
sur la ressource monitorée
V- Commandes SNMP
15
Requêtes SNMP
Recherche d’informations :
GetRequest : recherche d’une variable sur un agent
GetNextRequest : recherche de la variable suivante
GetBulkRequest : recherche d’un groupe de variables
Envoie d’informations :
Trap : détection d’un incident
Modification de valeurs :
SetRequest : permet de changer la valeur d’une variable
d’un agent
V- Commandes SNMP
16
Réponses SNMP
Une seule réponse existe.
Elle est différente s’il y a une erreur ou pas.
Aucune erreur :
GetResponse : renvoie la ou les valeurs souhaitées
En cas d’erreur :
GetResponse mais accompagné d’un NoSuchObject
VI- Evolution SNMP
17
Il existe 3 versions du protocole :
SNMP v1 qui reste la version la plus légère
SNMP v2 est une version délaissée car trop complexe. Elle
assure un niveau plus élevé de sécurité (authentification,
cryptage…), des messages d’erreurs plus précis, …
SNMP v3 permet de disposer des avantages de la version
2 sans en présenter les inconvénients. Elle définit un
nouveau modèle de sécurité USM (User-based Security
Model) évitant le décryptage des messages de
commande qui transitent sur le réseau et autorise des
droits différents en fonction des utilisateurs.
VII- Trame SNMP
18
Un paquet SNMP : Version Communauté PDU
Version :
SNMPv1 : version la plus employée, pas sécurisée,
vérification sur la communauté
SNMPv2 : plusieurs versions 2 expérimentales
SNMPv3 : sécurisée, en cours de déploiement (depuis
1999)
Communauté :
Domaine de gestion
PDU (Packet Data Unit) :
Contient le type du paquet et une liste de variables (et
d’autres informations)
Identique pour les requêtes et les réponses
VII- Trame SNMP
19
VII- Trame SNMP
20
Version : il vaut 0 pour SNMP v1, 1 pour v2 et 3 pour SNMPv3
Communauté : définit par l’administrateur en hexadécimal
Type : 0 pour GetRequest, 1 pour GetNextRequest, 2 pour
Response, 3 pour SetRequest, 4 pour Trapv1, 5 pour
GetBulkRequest, 6 pour InformRequest, 7 pour Trapv2, 8 pour
Report
ID : la requête et la réponse associée ont le même identifiant
Statut d'erreur : spécifie le type d’erreur
Index d'erreur : spécifie la variable qui est source d'erreur
VII- Trame SNMP
21
Entreprise : nom de l'agent qui transmet le message
Adresse Agent : permet au manager de savoir de quel
agent il s'agit
Alarme générique : type d’alarme
Alarme spécifique : elle est utilisée afin d'identifier une TRAP
spécifique à une entreprise
Nombres objets simples : Lit les n premiers objets simples
(comparable à un snmpget)
Nombre maximum de répétitions : Essaie de lire les m
occurrences des objets désignés (comparable à un
snmpgetnext)
VII- Trame SNMP (v3)
22
VIII- Exemples de Configuration
23
1- Windows :
VIII- Exemples de Configuration
24
2- Unix :
Installer tout d’abord Le paquet snmpd qui fournit un
ensemble d'outils en ligne de commande pour
émettre des requêtes SNMP aux agents.
VIII- Exemples de Configuration
25
3- Switch Cisco :
Création d’un nom de communauté « public » en lecture
seulement ou en lecture et écriture :
#snmp-server community nom_communauté RO
#snmp-server community nom_communauté RW
Configuration de la machine (Manager SNMP) qui recevra
les messages traps :
#snmp-server host @ip version 2c nom_communauté
Activation des messages traps en cas d’alerte sur l’agent :
#snmp-server enable traps
26
IX- Quelques Solutions
Chaque solution doit offrir une vision en temps réel du
bon état de santé de votre architecture informatique
(matériels et logiciels)
C’est un ensemble d’outils logiciels qui permet au
manager de contrôler le bon fonctionnement des
équipements informatiques par des alertes sur des
pannes ou des atteintes de seuils prédéfinis.
27
IX- Quelques Solutions
NAGIOS
Nagios (anciennement appelé Netsaint) est une
application permettant la surveillance système et
réseau. Elle surveille les hôtes et services spécifiés,
alertant lorsque les systèmes vont mal et quand ils
vont mieux. C’est un logiciel libre sous licence GPL
ZABBIX
ZABBIX est un logiciel open source créé par Alexei
Vladishev. Il permet de surveiller le statut de divers
services réseau, serveurs et autres matériels réseau.
Distribué sous licence GPL v2
28
IX- Quelques Solutions
OPENNMS
OpenNMS est un outil de supervision de réseau Open
Source. Il est développé en Java et s’appuie sur le
moteur applicatif Jetty et la base de données
PostgreSQL pour fonctionner
SHINKEN
Shinken est une application permettant la surveillance
système et réseau. Elle surveille les hôtes et services
spécifiés, alertant lorsque les systèmes vont mal et
quand ils vont mieux. C’est un logiciel libre sous
licence GNU AGPL et compatible avec Nagios
29
IX- Quelques Solutions
CENTREON
Centreon est le progiciel Open Source au cœur de la
suite Centreon, il vous permet de superviser
l’ensemble de vos infrastructures et applications
composant votre système d’information. Il fait parti
des solutions majeures de supervision libre
OpManager (ManageIngine)
ADDVISION (ADDIXI)
PYGRAM