Question Quel outil utilisez-vous pour surveiller vos serveurs?


Pour une liste plus complète des outils de surveillance et de leurs fonctionnalités, consultez cette page Wikipedia.

Comme le dit la question, quels sont les outils les plus couramment utilisés pour cette tâche et quels sont leurs points forts et leurs points faibles?


187


origine


Quelle est la plate-forme de votre serveur en cours d'exécution? - Glenn Slaven
Mes serveurs exécutent Debian Lenny, mais la question ne concerne pas uniquement la surveillance UNIX, car de nombreux outils auront probablement une forme de support multiplate-forme. - Aron Rotteveel
Ils utilisent peut-être des outils différents, mais d'un point de vue système global, vous finissez par faire la même chose encore et encore sur les différents systèmes. C'est juste un peu de script pour extraire le dernier bit de données que vous voulez. Dans ce contexte, je considérerais les "outils" comme une instance d'enregistrement (serveur de surveillance) et non comme le plugin / script proprement dit qui crache les données. - serverhorror
J'aime également surveiller les applications (performances, disponibilité, etc.). Les outils de surveillance semblent avoir un spectre avec leur capacité à surveiller le matériel d'un côté et leur capacité à surveiller les applications de l'autre. Application matérielle <----- + -----> - Nathan Hartley


Réponses:


J'ai utilisé Nagios dans le passé avec succès. Il est très extensible (plus de 200 add-ons), relativement facile à utiliser et plein de rapports. Un négatif serait la configuration initiale.


136



Nagios fonctionne très bien pour surveiller tous les types d’hôtes (Windows, Linux, routeurs, commutateurs, etc.). Je recommande d’utiliser un outil de configuration comme fruity ou Lilacto pour faciliter la configuration. NSClient ++ sur les fenêtres et nagios-statd sur Linux pour surveiller les processus en cours, l'utilisation du disque, etc. - TonyB
Malheureusement, Nagios a besoin d’un agent sous Windows - jadis, j’avais trouvé cet agent notoirement enclin à mourir aléatoirement. - PowerApp101
Nous avons examiné Nagios et Zabbix pour notre surveillance. Zabbix a gagné après une courte évaluation, principalement en raison de la facilité de déploiement et de la fonctionnalité (par exemple, Zabbix inclut la représentation graphique en tant que fonction principale, tandis que Nagios nécessite un plug-in). J'ai trouvé la configuration de Nagios compliquée.
GroundWork OpenSource dispose d’une appliance de surveillance réseau reposant essentiellement sur Nagios, ce qui simplifie l’installation / la gestion. - Rog
Il y a un nouveau fork de nagios appelé icinga. Ce n'est pas encore arrivé, mais leurs objectifs semblent prometteurs. icinga.org - cstamas


Cactus est une très bonne interface Web pour RRDTool, fournissant des graphiques et des statistiques très utiles. RRDTool est la partie qui rassemble les données de plusieurs systèmes et surveille un large éventail de données techniques.

Nous utilisons cette solution cacti / RRDTool pour surveiller les systèmes Unix et Windows. Nous obtenons de nombreuses mesures utiles, notamment la charge, l'utilisation du processeur / RAM, de l'espace HD, des utilisateurs connectés, du trafic réseau, des processus en cours, etc.

Vous trouverez plus d'informations sur les cactus sur le site Qu'est-ce que les cactus? page.


70



Cacti est une solution amusante qui a fière allure et qui est offerte à un prix avantageux (gratuit). Cependant, la configuration des périphériques réseau est un PITA et a été mal documentée. Ce serait peut-être mieux maintenant, mais je ne m'y engagerais pas tant que vous n'auriez pas fait vos recherches. - Chris Porter


Personnellement j'adore Munin ce qui est très facile à installer et à écrire des plugins car son architecture est très simple. Il y a déjà pas mal de plugins pour tous les objectifs que vous pouvez imaginer, vous n'aurez donc probablement même pas besoin d'écrire des plugins en premier lieu.

Il fournit également de beaux graphiques et la possibilité de configurer des alertes (très basiques).


57



Je suis aussi un grand fan de Munin. Il prend en charge l'intégration avec Nagios (pour que vous puissiez exécuter les deux) et prend en charge toutes les versions courantes de Unix. Je ne pense pas que l'assistance à la surveillance d'un nœud Windows soit prise en charge. Toutefois, il est écrit en Perl. Par conséquent, même s'il peut être non trivial, il devrait certainement l'être. possible. - John Dalton
@John. Les nœuds Windows sont pris en charge via munin-node-win32, qui est un nœud munin natif, ou via SNMP, comme tout hôte. - Steve Schnepp


Zabbix. Il est open-source et relativement simple à configurer et à personnaliser. De nombreux scripts de surveillance personnalisés alimentent le serveur zabbix, mais celui-ci s’occupe de centraliser ces données, de les afficher de manière appropriée, de notifications (courrier électronique, messagerie instantanée, SMS, Twitter, etc.), etc.


34



Nous utilisons également Zabbix et le trouvons assez puissant et configurable. Nous avons testé à la fois Zabbix et Nagios et avons finalement opté pour Zabbix car, bien que Nagios semble avoir une bonne réputation, il est un peu difficile à installer et de nombreuses fonctionnalités proviennent de plugins plutôt que de les intégrer à l’application principale (le graphisme est une bon exemple, vous l’obtenez gratuitement avec Zabbix).
Je préfère Zabbix pour sa flexibilité en termes de représentation graphique et de cartographie de votre infrastructure (en termes de disponibilité) ainsi que pour un mode de surveillance flexible. - Andrioid


Je fais des déploiements de Spiceworks dans notre entreprise et nous trouvons que c'est un excellent outil, non seulement pour surveiller les serveurs, mais pour tout le reste du réseau.

Il effectue des opérations telles que l'inventaire automatique et la surveillance personnalisée pour vous envoyer des courriels en cas de problème (par exemple, le nombre d'imprimantes est réduit à 10% ou le disque dur de ce serveur en contient 20%).

Son inconvénient serait probablement la densité d’informations par ordinateur. Ne vous y trompez pas: il contient BEAUCOUP de données par machine, mais pour des serveurs tels que les serveurs sur lesquels vous souhaitez disposer de nombreuses statistiques, vous pourriez avoir besoin d’utiliser un autre outil.

MODIFIER: Oh, ai-je mentionné que son modèle commercial est basé sur le fait qu'il est libre pour toujours


29



Spiceworks fait beaucoup de choses géniales - et GRATUIT.
SpiceWorks possède une très grande communauté qui chevauche également ServerFault. Va être intéressant de voir l'interaction entre les communautés. J'utilise aussi SpiceWorks. Outil génial. - Scott Alan Miller
J'utilise maintenant ceci en fonction de votre recommandation. Excellent outil. - Marko Carter
Nous l'utilisons dans notre travail. C'est assez impressionnant. L’inventaire du matériel, sans parler des logiciels, vaut la peine d’être examiné seul. - Terry
La dernière fois que j'ai utilisé Spiceworks (version 3 quelque chose), il ne disposait d'aucun moyen d'ajouter ou de modifier des composants matériels tels que des moniteurs, des cartes vidéo, etc. Il les détecterait, mais souvent de manière incorrecte. Donc, j'utilise toujours GLPI + OCSNG que je haine. - Boden


Fumant non seulement vérifie la disponibilité de divers serveurs et services, mais conserve également une trace de leur temps de latence tout en offrant une interface conviviale, agréable et esthétique. rapide à afficher graphiques.

Une large gamme de plug-ins de mesure de latence est disponible prête à l'emploi. Si vous connaissez Perl, il est facile de créer les vôtres pour tous vos besoins exotiques.

Les grandes installations bénéficieront du système maître / esclave pour les mesures distribuées.

Un système d'alerte hautement configurable vous aidera à remarquer les problèmes avant qu'ils ne commencent à affecter les utilisateurs ou à évoluer vers une panne majeure.

Smokeping est un logiciel gratuit et OpenSource écrit en Perl par Tobi Oetiker, créateur de MRTG et de RRDtool.


18



Il est bon de fumer à quoi ressemble votre réseau - Rory
Fumer est incroyable pour visualiser la latence. - James


OpenNMS est utilisé là où je travaille pour surveiller plus d’un millier de machines Linux. Nous surveillons le matériel de chaque machine et les applications qui y sont exécutées.


15



+1 pour OpenNMS, nous l’utilisons également au travail pour surveiller des milliers de machines et d’interfaces. Nous avons de nombreux systèmes d’exploitation différents et nous sommes en mesure de tous les surveiller à l’aide d’OpenNMS. - Steve K
pas mon premier choix mais très utile
comment est-il avec l'ajout de MIB pour le nouveau matériel? - slovon
OpenNMS a déjà beaucoup de statistiques snmp dans sa configuration par défaut, ce qui lui permet de détecter automatiquement et de commencer à tracer des graphiques. Les nouvelles statistiques SNMP sont assez faciles à ajouter. Il suffit de nommer le RRD, l’OID et le type de données, puis de les placer dans un groupe correspondant au type de périphérique auquel les statistiques s’appliquent. - mtinberg


Zenoss Core est utile (nous l’utilisons depuis environ un an) pour une surveillance légère des serveurs, des commutateurs de réseau et des onduleurs.

Zenoss Core est un produit de surveillance informatique open source primé qui gère efficacement la configuration, la santé et les performances des réseaux, des serveurs et des applications via un seul progiciel intégré.


15



Si vous utilisez la version gratuite de Zenoss Core, soyez prêt à peaufiner les modifications apportées à la MIB SNMP. J'ai également constaté qu'il refusait fermement de collecter les données du système d'exploitation sur certains de mes serveurs et qu'il était étonnamment difficile à configurer pour des tâches simples telles que la vérification du contenu d'une page Web. - gareth_bowles
Peut comprendre les problèmes de MIB, mais la vérification de page Web peut être effectuée avec les plugins Nagios sur Zenoss. - gimel


Nagios est génial car c'est gratuit et il y a beaucoup de plugins pour cela. Cependant, l'interface utilisateur et la configuration sont très difficiles.

C’est tout le contraire chez Microsoft System Center Operations Manager (SCOM) qui n’est pas gratuit, a moins de plugins mais la configuration et la configuration sont simples et brillantes.

Je dois admettre que si j’étais dans une société principalement Microsoft, si j’avais des exigences très strictes en matière de confiance (je ne peux pas me permettre une surveillance), ou si je devais envisager de faire travailler les développeurs, SCOM serait ma recommandation par rapport à Nagios.


12





J'ai utilisé:

  • Nagios - nécessite une configuration ancienne en ligne de commande, pas jolie, mais robuste et fonctionnelle. Il a été remplacé par:
  • Zenoss - nécessite beaucoup moins de jeu de jambes à mettre en place, a une variante commerciale. Une fois en cours d'exécution, le reste est contrôlé via un navigateur. Très puissant, mais nécessite quelques travaux MIB si vous utilisez la version gratuite.
  • Intermappeur - programme commercial, dépensier si vous avez beaucoup de nœuds à surveiller. Semble être écrit en Java (pour le meilleur ou pour le pire).
  • Spiceworks - n'a pas essayé la dernière version. Les anciennes versions nécessitaient un peu plus de euphorie pour le faire réagir, mais sinon, cela fonctionnait bien. La version gratuite est livré avec des annonces nag.

12



Nous utilisons beaucoup Intermapper. - sysadmin1138♦
J'utilise également InterMapper. Le client de la console est écrit en Java. Le serveur est écrit en Python. Postgres est utilisé comme base de données principale pour l’agrégation de données et la création de rapports. - lsiu


Nous utilisons AlertFox depuis quelques semaines et j'en suis très content. Il vérifie non seulement notre disponibilité et nos performances, mais surveille également le panier, les identifiants de l'utilisateur et d'autres parties critiques du site Web via des scripts de transaction (basés sur iMacros).

Pour notre surveillance interne (espace disque, etc.), nous utilisons Nagios.


11