La importancia de la hora en entornos de monitorización

Esta semana me ha tocado lidiar con un “problema” un poco peculiar, el tema de la hora del servidor. Y como los problemas siempre son una cadena de sucesos, voy a comentarlos de forma individual. Revisar hora del hwardware desde Linux

¿Entorno físico o virtual para la monitorización?

Aunque la recomendación siempre será que pongamos nuestro entorno de monitorización fuera de la plataforma de virtualización, la mayoría asume el riesgo de la caída del servidor “junto” al entorno de monitorización. Bien, podemos recomendar, aunque no imponer.

¿Con que servidor de tiempo sincronizo mi servidor de monitorización?

Antes de dar respuesta a la pregunta, voy a recordar, que uno de los checks que deberíamos tener en todos nuestros equipos, es la diferencia (en segundos) entre el equipo monitorizado y al AD. Creo que en esto podemos estar todos de acuerdo. Pero ¿y los controladores de dominio? (o los servidores NTP) ¿con que fecha los comparamos? Pues deberíamos hacerlo con la hora “global”, os argumento un par de razones:

  • Hay sistemas que “filtran” por la fecha. Por ejemplo, algunos sistemas antispam, nos pueden bloquear correos si los enviamos desde el futuro o el pasado.
  • Para las integraciones con terceros. Si tengo mal la hora de mi sistema, puedo mandar erróneamente procesos a colas de trabajo o peticiones de compras (por poner un par de ejemplos).

Así que debemos tener el sistema “sincronizado” con el mundo. Entonces mi equipo de monitorización, ¿contra que los sincronizo de tiempo? Pues contra el mundo directamente. Si lo hacemos por ejemplo contra el servidor NTP interno corremos el riesgo de que todos los equipos estén sincronizados entre ellos, pero desincronizados del mundo. Entonces tenemos solo dos posibles escenarios:

  • Falla un único servidor. Nos dice que lo tenemos adelantado 150 segundos. Fácil, a revisar que pasa en ese equipo.
  • Nos fallan simultáneamente todos los equipos, chequeando que van todos con 60 segundos de retraso. Fácil, nuestro NTP se ha desincronizado del mundo.

Mola, pero tomar nota de estos detalles:

  • Puede ser también que en caso de que fallen todos los equipos, sea precisamente el servidor de monitorización quien este desincronizado. Por eso es importante que pongamos algún check a nuestro servidor de monitorización para asegurarnos que la sincronización está funcionando correctamente.
  • En entornos virtuales (VMWare por ejemplo), puede venir defina una casilla que obliga al equipo virtual a sincronizarse con el ESXi, y cuidado, porque el ESXi puede a su vez estar desincronizado o sincronizado contra el NTP local.

Son detalles, lo sé, pero que es, sino la monitorización.

Añadir Comentario

* Información necesaria
1000
Captcha Imagen
Powered by Commentics

Comentarios (0)

No hay comentarios todavía. Sé el primero!
Ver más noticias