Apache Mesos
Apache Mesos es un kernel administrador de clúster de código abierto desarrollado en la Universidad de California, Berkeley. Mesos se ejecuta en cada nodo del clúster y provee aplicaciones (como Hadoop, Spark, Kafka entre otras) con API's para el manejo de recursos y planificación de tareas de todo el datacenter.[1]
Apache Mesos | ||
---|---|---|
Información general | ||
Tipo de programa | Clúster | |
Desarrollador | Apache Software Foundation | |
Lanzamiento inicial | 19 de junio de 2014 | |
Licencia | Apache License 2.0 | |
Estado actual | Activo | |
Información técnica | ||
Programado en | C++ | |
Versiones | ||
Última versión estable | 1.6.0 ( 17 de mayo de 2018 (6 años, 8 meses y 2 días)) | |
Enlaces | ||
Ha sido adoptado por varias compañías de software grandes, incluyendo Twitter, Airbnb y Apple. Al menos 50 organizaciones actualmente usan Mesos.[2]
El 27 de julio de 2016, Apache Mesos anunció la disponibilidad de Apache Mesos v1.0. La adición más notable al software fue la “unificación de contenedores” esto permitió la capacidad de soportar Docker, rkt e instancias appc.
Historia
editarMesos empezó como un proyecto de investigación en el Laboratorio UC Berkeley RAD en ese entonces por los estudiantes de doctorado Benjamin Hindman, Andy Konwinski, y Matei Zaharia, así como el profesor Ion Stoica. Los estudiantes empezaron a trabajar juntos en el proyecto cómo parte de un curso de Tópicos Avanzados en Sistemas de Computadores por David Culler. Fue originalmente nombrado Nexus, pero debido a un conflicto con el proyecto de otra universidad, fue rebautizado a Mesos.[3]
La primera presentación de Mesos fue en 2009 (mientras todavía era llamado Nexus) por Andy Konwinski en HotCloud '09 en una charla que acompañaba el primer artículo científico publicado sobre el proyecto.[4] Más tarde en 2011 es presentado en un estado más maduro en una charla por Matei Zaharia en el USENIX, conferencia Symposium on Networked Systems Design and Implementation sobre el artículo "Mesos: Una Plataforma para administrar recursos compartidos en el Centro de procesamiento de Datos" por Benjamin Hindman, Andy Konwinski, Matei Zaharia, Ali Ghodsi, Anthony D. Joseph, Randy Katz, Scott Shenker, Ión Stoica.[5]
El 27 de julio de 2016, la Apache Software Foundation anunció la versión 1. Esta agregó la capacidad de suministrar centralmente instancias de Docker, rkt y appc.
Características
editarEscalado lineal
editarMesos puede escalar linealmente fácilmente hasta 10,000 nodos.
Alta disponibilidad
editarEs tolerante de fallos, ya que puede generar réplicas del nodo maestro. Además se integra fácilmente con Zookeeper.
Contenedores
editarProvee soporte nativo para la ejecución de imágenes de contenedores Docker y AppC.
Aislamiento
editarMesos usa Linux Cgroups para proporcionar aislamiento de CPU, memoria, I/O y sistema de archivos.
Dos niveles de planificación
editarProvee soporte para correr aplicaciones nativas de cloud, así como aplicaciones legadas en el mismo clúster con políticas de planificación.
APIS
editarProvee API HTTP para que los desarrolladores puedan crear sus propias aplicaciones distribuidas, así para desarrollar aplicaciones de operación y monitoreo del clúster.
WEB UI
editarPor defecto, ya viene con una interfaz gráfica web para poder visualizar el estado del clúster, aplicaciones que corrieron, logs, entre otros datos.
Multiplataforma
editarCorre en Linux , OSX y Windows.
Arquitectura
editarMesos utiliza un mecanismo de dos niveles de planificación en donde se ofrecen recursos a frameworks (aplicaciones que corren arriba de Mesos). Cada nodo agente (esclavo) le informa al nodo maestro cuantos recursos disponibles tiene. El nodo maestro posee una lista de todos esos recursos disponibles y decide cuántos recursos puede ofrecer a cada framework, mientras que cada framework determina los recursos que acepta y qué aplicación ejecutar en estos recursos. Este método de asignación de recursos permite un acercamiento óptimo de la ubicación de datos cuándo se comparte un clúster de nodos entre frameworks diversos.
Dentro de un clúster se pueden identificar dos tipos de nodos de Mesos, maestros y agentes. Aquellos que son maestros, reciben solicitudes para ejecutar trabajos que provienen de algún framework y los mandan a ejecutar sobre nodos agentes, a su vez estos son encargados de reservar recursos para que las tareas de esos frameworks puedan ejecutar en los nodos agentes.
Nodos maestros, son pocos, pero se recomienda tener un mínimo de 3 de ellos, para continuar el servicio ante la caída de alguno y poder llamar a un votación de mayoría (mitad más uno de un quorum) para saber quién será el próximo nodo a ser el que estará como activo, para esto se utiliza ZooKeeper.
Los nodos agentes son aquellos, que por lo general se dispone de grandes cantidades, y sobre ellos se ejecutarán las tareas de los frameworks.
Arquitectura típica
editarLa estructura básica para tener un clúster consiste de tener los siguientes componentes:
- Tres Mesos máster, uno en activo y dos pasivos (Standby)
- Tres Zookeepers
- Tres agentes (Mesos Slaves)
Si bien en esta estructura se tienen tres nodos máster, la idea es que solo uno de ellos este activo mientras que los otros deberían estar en un estado pasivo. Los dos nodos pasivos se mantendrán en ese estado a la espera de que el nodo activo pueda fallar y así asumir el rol de nodo máster activo.
Competencia
editarMesos es a menudo comparado con Google Omega scheduler, una plataforma altamente secreta utilizada internamente para dirigir y distribuir los servicios de Google.[6]
Tecnología
editarMesos usa los Cgroups de Linux para proveer aislamiento para CPU, memoria, I/O y el sistema de archivos. Mesos es la base para un numerosos sistemas distribuidos. Estos sistemas distribuidos son llamados frameworks.[cita requerida]
Apache Aurora
editarApache Aurora es un framework de Mesos para servicios de corrida prolongada y trabajos cron, originalmente desarrollado por Twitter a comienzos del 2010 y de código abierto a fines del 2013.[7] Puede escalar a decenas de miles de servidores, y contiene muchas similitudes con Borg scheduler de Google incluyendo su ADSL rico para configurar servicios.[8][9]
Chronos
editarChronos es un sistema distribuido cron-like, es elástico y también puede expresar dependencias entre trabajos. Puede escalar a miles de servidores físicos y es, lo más parecido a Mesos framework, completamente elástico y a prueba de fallos.[10]
Marathon
editarMarathon es un popular PaaS o sistema de orquestación de contenedores que escala a miles de servidores físicos. Esta completamente basado en REST y permite despliegues del estilo canary y topologías de despliegue. Está escrito en Scala y es altamente disponible, elástico, y distribuido.[11]
Funcionamiento de los agentes
editarComo se explica en las secciones anteriores, las tareas que se lanzan en los agentes estas aisladas. Este aislamiento por defecto se hace utilizando los Cgroups de Linux. También Docker hace esto de forma nativa, cuando la tarea llega al agente, este crea un nuevo Cgroup y se lo asigna a la tarea.
Cuando se ejecuta una tarea, esta efectúa almacenamiento de datos, cachés y de más información necesaria para que el servicio corra. Debido a esto, si un agente fallara podría ocasionar problemas en sus tareas. Para mitigar esos problemas Mesos ofrece una serie de herramientas:
Checkpoints
Los agentes realizan checkpoints sobre el estado de la tarea. Estos checkpoints funcionan como copias de seguridad del estado, para que en el caso de que tengamos que reiniciar el agente, la recuperación sea más rápida.
Cache executor
En el caso de que el servicio de mesos-slave no este disponible, las nuevas tareas y peticiones serán guardadas en memoria caché. Cuando el servicio este recuperado se empezaran a procesar las peticiones que fueron guardadas.
Conexión
Una tarea que ya se ejecutó anteriormente tendrá más posibilidades de volverse a ejecutar en el mismo Cgroup y el mismo agente que lo hizo la última vez, de esta manera la información se puede recuperar.
Fallo del agente
En el caso de fallo completo de un agente, el framework solicitará volver a montar la tarea en un nuevo agente.
Usuarios prominentes
editarEL sitio de redes sociales Twitter empezó utilizar Mesos y apache Aurora en 2010, después de que (entonces estudiante de doctorado) Benjamin Hindman dio una presentación a un grupo de ingenieros de Twitter.[6]
Airbnb dijo en julio del año 2013 que usa Mesos para correr numerosos sistemas de procesamiento de datos como apache Hadoop y Apache Spark.[12]
El sitio web de subasta eBay declaró en abril de 2014 que usa Mesos para correr integración continua en un ambiente de desarrollo. Logran este cometido utilizando un plugin de Mesos customizado que permite a los desarrolladores lanzar su propias y privadas instancias de Jenkins.[13]
En abril de 2015, fue anunciado que el servicio Siri de Apple está utilizando su propio framework Mesos llamado Jarvis.[14]
En agosto de 2015, fue anunciado que Verizon ha seleccionado Mesosphere's DCOS, el cual está basado en un Apache Mesos de código abierto Mesos, cómo su orquestador de centro de datos para su plataforma a nivel nacional.[15]
En noviembre de 2015, Yelp anunció que habían estado utilizando Mesos/Marathon por un año y un medio para servicios de producción.[16]
Soporte comercial
editarMesosphere vende el Centro de Datos Sistema operativo, un sistema operativo distribuido, basado en apache Mesos.[17] En septiembre de 2015, Microsoft anunció una sociedad comercial con Mesosphere para construir un planificador de contenedores y servicios de orquestación para Microsoft Azure.[18]
Referencias
editar- ↑ «Apache Mesos». Apache Mesos (en inglés estadounidense). Consultado el 1 de julio de 2017.
- ↑ «Organizations using Mesos». mesos.apache.org. Consultado el 12 de enero de 2015.
- ↑ «HUG Meetup August 2010: Mesos: A Flexible Cluster Resource manager - Part 1». youtube.com. Consultado el 13 de enero de 2015.
- ↑ Un Substrato Común para Informática de Grupo
- ↑ Hindman, Benjamin; Konwinski, Andy; Zaharia, Matei; Ghodsi, Ali; Joseph, Anthony; Katz, Randy; Shenker, Scott; Stoica, Ion (2011). «Mesos: A Platform for Fine-Grained Resource Sharing in the Data Center». NSDI 11: 22-22. Consultado el 12 de enero de 2015.
- ↑ a b «Return of the Borg: How Twitter Rebuilt Google’s Secret Weapon». wired.com. Wired. Consultado el 12 de enero de 2015.
- ↑ «All about Apache Aurora». Twitter. Consultado el 20 de mayo de 2015.
- ↑ «Large-scale cluster management at Google with Borg» (PDF). Google. Consultado el 20 de mayo de 2015.
- ↑ «Twitter's Aurora and How It Relates to Google's Borg». Consultado el 20 de mayo de 2015. «Twitter's Aurora and How It Relates to Google's Borg». Consultado el 20 de mayo de 2015. «Twitter's Aurora and How It Relates to Google's Borg». Consultado el 20 de mayo de 2015.
- ↑ «Chronos». GitHub.com. GitHub. Consultado el 30 de marzo de 2015.
- ↑ «Marathon». Mesosphere.GitHub.io. Mesosphere. 2014. Consultado el 30 de marzo de 2015.
- ↑ «Airbnb is engineering itself into a data-driven company». gigaom.com. Consultado el 12 de enero de 2015.
- ↑ «Delivering eBay’s CI Solution with Apache Mesos - Part I». EbayTechBlog.com. eBay. Consultado el 12 de enero de 2015.
- ↑ Harris, Derrick (23 de abril de 2015). «Apple Details How It Rebuilt Siri on Mesos». Mesosphere.com. Mesosphere. Archivado desde el original el 29 de abril de 2015. Consultado el 27 de abril de 2015.
- ↑ «Verizon selects Mesosphere DCOS as nationwide platform for data center service orchestration». Verizon. Consultado el 21 de agosto de 2015.
- ↑ «Introducing PaaSTA: An Open, Distributed, Platform as a Service». engineeringblog.yelp.com. Consultado el 12 de julio de 2016.
- ↑ «The Mesosphere DCOS». mesosphere.com. Consultado el 13 de enero de 2015.
- ↑ Mary Jo Foley (29 de septiembre de 2015). «New Azure Container Service to bring together Mesos, Docker and Azure cloud». ZDNet.