Lo optimo en un departamento técnico es que debería ser más proactivo que reactivo, esto en la mayoría de los casos no es así, normalmente se termina apagando fuegos por problemas que surgen de imprevisto y esto puede llegar abrumar al departamento IT hasta entrar en un circulo del que salir es complicado y se asume que la realidad es resolver los problemas cuando ya han surgido.
En nuestra vida cotidiana realizamos muchas acciones preventivas, pero hay quien prefiere ir al medico solo cuando tiene unos síntomas ya muy agudos, mientras otras personas se quedan mas tranquilas haciendo un chequeo periódico y resolver cualquier problema detectado antes de parecer el síntoma, lo mismo ocurre con los vehículos que llevamos al taller para realizar un mantenimiento preventivo antes de que surja un problema en cualquier otra pieza que sufre un desgaste.
Existen procedimientos preventivos en el mundo IT pero estos se deben controlar y en muchas ocasiones se convierte una tarea ardua y que depende de la intervención humana. Un ejemplo es el control de la temperatura de la sala de servidores, aun hoy en día muchas empresas que disponen de estas instalaciones observan presencialmente los indicadores de temperatura de la sala para saber si los servidores están funcionando en un entorno optimo, nadie va a saber si a las 3 de la mañana la temperatura de la sala se eleva demasiado a causa de un fallo en el sistema de refrigeración y los servidores se apagan automáticamente para evitar un sobrecalentamiento, lo que se conoce como «una mañana de pánico» llegas a la oficina y nada funciona.
Para ello existen herramientas como Nagios que ayudan al departamento IT a monitorizar todos los servicios y eventos imprescindibles para día a día de una empresa.
¿Qué es Nagios?
Es un sistema de monitorización mediante redes informáticas capaz de controlar equipos (hardware) y servicios (software) para comprobar si funcionan y si lo hacen de forma correcta, Nagios esta licenciado como GPLv2 por lo que es gratuito y de código abierto.
Nagios es un software que se instala en sistemas Linux y proporciona una gran versatilidad para monitorizar cualquier sistema conectado a la red de nuestra empresa y si alguno falla o funciona erróneamente nos puede avisar por correo electrónico, SMS o por cualquier otra vía a la que podamos conectar Nagios.
No existe limite en lo que se puede hacer mediante Nagios ya que todos los eventos son programables mediante scripts que Linux puede interpretar, como sh, perl, c, php, etc.
¿Qué se puede monitorizar?
Estado del hardware CPU, Disco Duro, RAM, red, etc.
Estado del software para servicios como web (HTTP), correo (POP3 y SMTP), bases de datos SQL, SNMP, etc.
Estado del networking como Routers, Switch, Firewall, VPN, etc.
Impresoras, estado del Toner, Fusor y atascos o falta de hojas en la bandeja.
Y todo lo que tenga una IP y se le pueda «interrogar» si esta operativo y cual es su estado.
No solo equipos informáticos
Con Nagios se puede monitorizar otros servicios industriales que se permitan conectar en una red informática, como por ejemplo sondas en tanques de gas, gasolina, agua potable o incluso sistemas SCADA o PLC’s.
Por ejemplo se puede llevar un control del porcentaje de humedad en un tanque de gasolina instalado en una gasolinera.
En definitiva: con Nagios se pueden controlar procesos para una mejor prevención de los problemas que se producen tanto en el departamento IT como en otros procesos industriales.
En otro articulo voy a explicar como instalar Nagios y como configurar la monitorización de algunos servicios y enviar avisos cuando algo falla.
Wilberth dice
Excelente post, seguiré de cerca los post que puedas subir hacer a de Nagios ya que estoy empezando a estudiar acerca de el para implementarlo para llevar el control de la infraestructura donde trabajo.