Check MK
Checkmk es un software desarrollado en Python y C++ para el monitoreo de infraestructuras de TI. Se utiliza para el monitoreo de servidores, aplicaciones de software, redes, infraestructuras en la nube (públicas, privadas e híbridas), contenedores, almacenamiento de datos, bases de datos y sensores.[3]
Checkmk | ||
---|---|---|
Información general | ||
Tipo de programa | IT Infrastructure Monitoring | |
Desarrollador | tribe29 GmbH (previously Mathias Kettner GmbH) | |
Lanzamiento inicial | 2008 | |
Licencia | GNU GPL v2 and other Open Source licenses, Checkmk Enterprise License.[2] | |
Información técnica | ||
Programado en | Python, C++ | |
Versiones | ||
Última versión estable | 2.3.029 de abril de 2024 | |
Última versión en pruebas | 1.6.0b512 de agosto de 2019 | |
Enlaces | ||
Historia
editarCheckmk se originó en 2008 como un agente que sustituye al shell script para Inetd, y fue publicado en abril de 2009 bajo la GPL.[4] Inicialmente se basó en Nagios, y lo extendió con una serie de nuevos componentes.[5][6] La edición de código abierto (Checkmk Raw Edition) continúa basándose en el núcleo de Nagios, y lo agrupa con componentes adicionales de código abierto en un sistema completo.[7]
A lo largo de los años, las ediciones comerciales de Checkmk se han convertido en un sistema de monitoreo contenido en sí mismo. Se han reemplazado todos los componentes esenciales de Nagios por componentes propios, incluyendo su propio núcleo de monitoreo.[8] La mayoría de los desarrollos para las ediciones comerciales, en particular todos los complementos, también están disponibles en la Edición Checkmk Raw.
Mientras que en el pasado Checkmk fue diseñado para monitorear entornos locales grandes y heterogéneos, desde la versión 1.5+ (1.5p12) también admite el monitoreo de los servicios de AWS, Azure, Docker y Kubernetes.[9]
Checkmk está siendo desarrollado por tribe29 GmbH en Múnich Alemania,[10] que operaba bajo el nombre de Mathias Kettner GmbH hasta el 16 de abril de 2019. Junto con el cambio de nombre de la compañía, el nombre del producto "Check_MK" también se cambió a "Checkmk".
tribe29 GmbH sigue un modelo de negocio de Código de Núcleo abierto. La edición de código abierto está disponible bajo diferentes licencias, principalmente GPLv2, mientras que gran parte de las ediciones comerciales se rigen bajo la "Licencia empresarial Checkmk".
Características
editarCheckmk se distribuye en tres ediciones:[11] una edición de código abierto ("Checkmk Raw Edition - CRE"),[12] una edición comercial empresarial ("Checkmk Enterprise Edition - CEE") y una edición comercial para proveedores de servicios administrados ("Edición Checkmk Managed Services - CME"). Todas las ediciones Checkmk están disponibles en una variedad de plataformas, en particular para varias versiones de Debian, Ubuntu, SLES y RedHat / CentOS, y también como una imagen Docker.[13] Además, se ofrecen dispositivos físicos de varios tamaños, así como un dispositivo virtual para simplificar la administración del sistema operativo subyacente usando una interfaz gráfica de usuario, para obtener soluciones de alta disponibilidad. Los agentes utilizados por Checkmk para recopilar datos están disponibles para 11 plataformas, incluido Windows.[14]
Checkmk combina tres tipos de monitoreo de TI:
- Monitoreo basado en estado, que (con umbrales de referencia) registra la "salud" de un dispositivo o aplicación.
- Monitoreo basado en métricas que permite el registro y análisis gráfico de series temporales. Para la CEE, están disponibles un sistema gráfico basado en HTML5 y con integración a Grafana.[15]
- Monitoreo basado en registros y eventos, en el que los eventos clave se pueden filtrar y las acciones se pueden activar en función de estos eventos.
Con el fin de garantizar un vasto rango de objetivos monitoreables, Checkmk actualmente tiene más de 1700 complementos en cada edición, todos bajo la licencia GPLv2. Estos complementos se mantienen como parte del producto y se complementan regularmente con otros complementos o extensiones adicionales. También es posible conectar los complementos existentes de Nagios.
Para simplificar la configuración y el funcionamiento, todos los componentes de Checkmk se distribuyen completamente integrados. Una configuración 1: n basada en reglas, así como un alto grado de automatización aceleran significativamente los flujos de trabajo. Esto incluye:
- Descubrimiento automático de hosts (cuando corresponda).
- Descubrimiento automático de servicios[16]
- Configuración automatizada de complementos a través de umbrales y reglas preconfigurados.
- Actualizaciones de agente automatizadas (una característica de CEE).
- Configuración automática y dinámica que permite la supervisión de servicios volátiles con una vida útil de solo unos segundos, como en el entorno de Kubernetes (a partir de CEE v1.6)[17]
- Descubrimiento automatizado de etiquetas y etiquetas de fuentes como Kubernetes, AWS y Azure (a partir de CEE v1.6).
Además, también hay libros de instrucciones para el uso de herramientas de configuración e implementación como Ansible[18] o Salt.[19]
Checkmk se usa a menudo en entornos distribuidos muy grandes donde se monitorea una gran cantidad de sitios (por ejemplo, 300 ubicaciones de Faurecia[20]) y / o más de 100.000 dispositivos (por ejemplo, Edeka[21]). Esto es posible, entre otras cosas, porque el microcore de Checkmk consume muchos menos recursos de CPU que, por ejemplo, Nagios, y por lo tanto ofrece un rendimiento significativamente mayor en el mismo hardware. Además, los datos no persistentes se almacenan en la memoria RAM, lo que mejora significativamente el tiempo de acceso.
Componentes
editarEl núcleo de supervisión ("Checkmk Microcore - CMC")
editarLas ediciones comerciales de Checkmk usan su propio núcleo de monitoreo, escrito en C ++. Este tiene un rendimiento mucho mayor que el núcleo de Nagios. Además, a partir de la versión 1.6, permite la grabación dinámica de objetos con una vida útil corta, como Contenedores. Esto es posible porque, a diferencia del núcleo de Nagios, el Checkmk Microcore no requiere un reinicio al realizar cambios de configuración. La versión de código abierto "Checkmk Raw Edition" actualmente todavía usa el núcleo de Nagios.
Configuración y motor de verificación
editarCheckmk ofrece descubrimiento de servicios autónomos y generación de configuraciones. Checkmk utiliza su propio método al realizar los controles. Durante el período de prueba, se contacta a cada host solo una vez. Los resultados de la prueba se transmiten al núcleo de monitoreo como verificaciones pasivas. Esto mejora significativamente el rendimiento en el servidor de supervisión, así como en los hosts que se supervisan.
Checkmk utiliza diferentes métodos para acceder a los datos en los sistemas de destino. Estos incluyen agentes instalados en el sistema de destino, "agentes especiales" que se ejecutan en el servidor de monitoreo y se comunican con la API del sistema de destino, la API SNMP para monitorear, por ejemplo, dispositivos de red e impresoras, y protocolos HTTP/TCP para comunicarse con servicios web e internet. Por defecto, Checkmk sigue el "principio de extracción", es decir, el sistema de monitoreo consulta explícitamente los datos para identificar rápidamente cuándo un sistema falla repentinamente y no responde a una "extracción". Sin embargo, como alternativa, se puede configurar un "push" con el cual el sistema transfiere sus datos directamente a Checkmk o a un host intermedio.
Interfaz de datos ("Livestatus")
editarLivestatus es la interfaz principal en Checkmk. Proporciona acceso en vivo a todos los datos de los hosts y servicios monitoreados. Los datos se obtienen directamente de la RAM, lo que evita el acceso lento al disco duro y brinda acceso rápido a la información sin sobrecargar demasiado el sistema. El acceso se realiza a través de un protocolo simple y es posible desde todos los lenguajes de programación sin requerir una biblioteca especial.
Web-GUI ("Multisitio")
editarMultisitio es la GUI web de Checkmk. Además de tener un diseño de página rápido, ofrece vistas y paneles definibles por el usuario, monitoreo distribuido al integrar múltiples instancias de monitoreo a través de Livestatus, integración de NagVis, una conexión LDAP integrada, acceso a datos de estado a través de web services y mucho más. Los paneles y las vistas se pueden configurar independientemente para varios usuarios o grupos de usuarios, por ejemplo, vistas específicas de vSphere[22] para administradores de VMware. La GUI web está actualmente disponible en alemán e inglés.
Administración web ("WATO")
editarLa herramienta de administración web hace que un sistema basado en Checkmk sea completamente administrable a Navegador web. Esto incluye la administración de usuarios, roles, grupos, períodos de tiempo y más. Los permisos se pueden otorgar de forma granular utilizando un concepto de rol. Para esto se pueden usar los controles de acceso basados en roles existentes (Protocolo ligero de acceso a directorios o LDAP, Active Directory). La WATO funciona basada en reglas, de modo que la configuración sigue siendo intuitiva incluso en entornos complejos, y el esfuerzo necesario para realizarlo es bajo. El descubrimiento y la configuración automáticos, así como la actualización automática del agente aceleran aún más el proceso de configuración. Una API HTTP también se puede utilizar para integrar CMDB para una configuración acelerada.
Sistema de alerta
editarSe pueden configurar varios canales de notificación con diferentes reglas para cada usuario. Por ejemplo, los correos electrónicos se pueden activar en cualquier momento del día, pero las notificaciones por SMS se envían solo por problemas importantes durante el horario de servicio. Las notificaciones se pueden configurar para todos o para equipos específicos, por ejemplo, “notifique solo a los administradores de almacenamiento acerca de un disco duro fallido”. Las notificaciones duplicadas se agrupan para que ningún usuario sea notificado dos veces a través de un canal en particular. Además, los usuarios pueden configurar sus propias notificaciones ellos mismos. En entornos distribuidos, las alertas se pueden gestionar de forma centralizada. Para problemas detectados, las acciones se pueden activar automáticamente (control de alarma) a través de scripts.Checkmk incluye integraciones a puertas de enlace de correo electrónico y SMS, así como a soluciones de comunicación y gestión de servicios de TI como Slack , Jira , PagerDuty, OpsGenie , VictorOps y ServiceNow.
Inteligencia de negocios (BI)
editarEl módulo de BI está integrado en la interfaz gráfica de usuario. Agrega el estado general de los procesos comerciales, su dependencia de aplicaciones complejas y elementos de infraestructura de TI de muchos hosts y servicios individuales de una manera basada en reglas. También se puede usar para representar aplicaciones compuestas por microservicios, que a su vez consisten en módulos e implementaciones de Kubernetes. Además, los peores escenarios pueden simularse en tiempo real y los datos históricos pueden analizarse para comprender las causas de la degradación del rendimiento.
Consola de eventos
editarLa Consola de Eventos integra el procesamiento de mensajes de registro y SNMP traps en el monitoreo. Se configura a través de un conjunto flexible de reglas y decide si los mensajes entrantes deben descartarse, o cómo deben clasificarse. Puede contar, correlacionar, esperar mensajes, re-escribir mensajes y más. Las entradas similares se pueden agrupar en un solo evento (por ejemplo, múltiples inicios de sesión fallidos) para realizar un seguimiento de los eventos. También tiene un syslog daemon incorporado que recibe mensajes directamente en el puerto 514, y un receptor de SNMP traps que recibe traps en el puerto 162.
Gráficos de métricas
editarLas ediciones comerciales de Checkmk utilizan su propio sistema métrico y gráfico. Esto permite que las mediciones de series temporales se analicen durante largos intervalos utilizando gráficos HTML5 interactivos. La resolución máxima es de un segundo. Los datos pueden importarse desde una variedad de fuentes de datos y formatos de métricas (JSON, XML, SNMP, etc.) y almacenarse en el disco de un dispositivo de almacenamiento de datos a largo plazo.
Alternativamente, Graphite o InfluxDB se pueden conectar a través de una interfaz de exportación. Desde la versión 1.5p16 de CEE también hay un complemento disponible para integrar datos directamente desde Checkmk en Grafana para fines de visualización. Checkmk Raw Edition actualmente utiliza PNP4Nagios como su sistema de gráficos.
Reportes
editarLos reportes permiten la entrega directa de ficheros en PDF, ad hoc o automáticamente, y a intervalos regulares. Incluye el análisis de disponibilidad durante cualquier periodo, y se puede proporcionar con un solo clic. Los cálculos de disponibilidad pueden excluir tiempos no supervisados, ajustar la resolución o ignorar intervalos cortos. Además de los cálculos de disponibilidad, los informes también incluyen informes de Acuerdo de nivel de servicio (SLA) en los que se pueden monitorear SLA complejos. Los informes solo están disponibles en las versiones comerciales de Checkmk.
Inventario de hardware / software
editarEl inventario de hardware / software determina el inventario de todo el hardware y software instalado en dispositivos y sistemas. Esto se puede usar, por ejemplo, para monitorear cambios de hardware y software, para verificar la presencia de actualizaciones de seguridad instaladas y para actualizar datos estáticos con parámetros dinámicos (por ejemplo, actualizar las estadísticas actuales de uso del disco en función de los datos de monitoreo). La base de datos de la gestión de configuración (por sus siglas CMDB, específicamente i-doit CMDB)[23] tiene una integración profunda que permite el intercambio de datos CMDB con datos de monitoreo.
Incidencias
editarA lo largo de su historia Checkmk, ha presentado una serie de incidencias,[24] de las cuales las más importantes han sido las siguientes:
- Como componente integrado de monitorización en Red Hat Gluster Storage, en julio de 2015 se encontraron las siguientes vulnerabilidades y exposiciones comunes (CVE): CVE-2014-5338, CVE-2014-5339, CVE-2014-5340. Dichas vulnerabilidades permitían por medio de guion de sitios cruzados (XSS) escribir sus propios guiones en formato .mk para futuras ejecuciones arbitrarias de código.[25]
Véase también
editarReferencias
editar- ↑ tribe29 GmbH (31 de julio de 2019), «Checkmk stable release 1.5.0p21», Checkmk Announcement.
- ↑ «Checkmk EULA» (en inglés). tribe29 GmbH. Archivado desde el original el 21 de agosto de 2019. Consultado el 31 de mayo de 2019.
- ↑ «Use Cases» (en inglés). tribe29 GmbH. Consultado el 15 de junio de 2019.
- ↑ «Mathias Kettner (check_mk)». Meet The Community (en inglés). Nagios Enterprises. 17 de agosto de 2009. Archivado desde el original el 6 de enero de 2012. Consultado el 27 de noviembre de 2015.
- ↑ Rieger, Götz (3 de noviembre de 2012). «Einfach mal Nagios – Netzwerk-Monitoring mit OMD und Check_MK» (en alemán). c’t. p. 190. Consultado el 27 de noviembre de 2015.
- ↑ Huber, Mathias (9 de marzo de 2011). «Nagios-Erweiterung Check_mk in Version 1.1.10» (en alemán). Linux Magazine. Consultado el 27 de noviembre de 2015.
- ↑ Siering, Peter (31 de mayo de 2017). «Monitoring-System Check_MK in frischer Version 1.4.0» (en alemán). Heise Online. Consultado el 31 de mayo de 2017.
- ↑ Kettner, Mathias. «The Checkmk micro core (CMC)» (en inglés). Consultado el 5 de diciembre de 2018.
- ↑ «Checkmk community announcement 1.5 Plus(1.5.p12)» (en inglés). tribe29 GmbH. 17 de febrero de 2019. Archivado desde el original el 12 de julio de 2019. Consultado el 11 de julio de 2019.
- ↑ «tribe29 - Our Story» (en inglés). tribe29 GmbH. Archivado desde el original el 12 de julio de 2019. Consultado el 14 de junio de 2019.
- ↑ «Checkmk Editions» (en inglés). tribe29 GmbH. Consultado el 27 de noviembre de 2015.
- ↑ «Open Source IT monitoring with Checkmk» (en inglés). tribe29 GmbH. Consultado el 1 de julio de 2019.
- ↑ «Download version» (en inglés). tribe29 GmbH. Consultado el 10 de julio de 2019.
- ↑ «Monitoring Agents» (en inglés). tribe29 GmbH. Consultado el 12 de junio de 2019.
- ↑ Mueller, Christian (17 de abril de 2019). «Grafana Data Source Plugin». GitHub (en inglés). Consultado el 9 de julio de 2019.
- ↑ «Automatic Service Discovery» (en inglés). tribe29 GmbH. Consultado el 17 de febrero de 2017.
- ↑ «Monitoring of highly dynamic environments» (en inglés). tribe29 GmbH. Consultado el 7 de mayo de 2019.
- ↑ «Ansible integration with Checkmk». GitHub (en inglés). 1 de mayo de 2019. Consultado el 8 de mayo de 2019.
- ↑ «Salt integration with Checkmk». GitHub (en inglés). 2 de mayo de 2019. Consultado el 9 de mayo de 2019.
- ↑ «Global deployment of Check_MK at Faurecia» (en inglés). 23 de octubre de 2018. Consultado el 23 de octubre de 2018.
- ↑ «EDEKA Vortrag» (en alemán). 12 de mayo de 2017. Consultado el 12 de mayo de 2017.
- ↑ Heike Jurzik, Marcel Arentz (1 de julio de 2019). «vSphere-Monitoring mit Checkmk» (en alemán). Linux-Magazin. Consultado el 2 de julio de 2019.
- ↑ i-doit Open Features
- ↑ Real Academia Española. «incidencia : Acontecimiento que sobreviene en el curso de un asunto o negocio y tiene con él alguna conexión.». Diccionario de la lengua española (23.ª edición). Consultado el 23 de julio de 2018.
- ↑ «RHSA-2015:1495 - Security Advisory» (html). Red Hat (en inglés). 29 de julio de 2015. Archivado desde el original el 18 de julio de 2019. Consultado el 17 de abril de 2020. «Multiple flaws were found in check-mk, a plug-in for the Nagios monitoring system, which is used to provide monitoring and alerts for the Red Hat Gluster Storage network and infrastructure: a reflected cross-site scripting flaw due improper output encoding, a flaw that could allow attackers to write .mk files in arbitrary file system locations, and a flaw that could possibly allow remote attackers to execute code in the wato (web based admin) module due to the unsafe use of the pickle() function.»
Enlaces externos
editar- Sitio web oficial
- Computer monitoring with the Open Monitoring Distribution (Kelvin Vanderlip, 2012-03-01)
- Using the Open Monitoring Distribution(Nagios) to Monitor Complex Hardware/Software Systems (Joe VanAndel, 2012-03-29)