Clústeres Databricks - wandent/mutual-wiki GitHub Wiki

Databricks Metrics

[[TOC]]

En Databricks para monitoreo de rendimiento para los clústeres, internamente Databricks posee una herramienta para monitoreo de los contadores de rendimiento para las maquinas dentro del clúster.

image.png

Ganglia es la herramienta que permite ver los contadores de performance para todo el cluster, en distintas vistas en el tiempo y mirar a la carga de trabajo por un mapa de calor en cada uno de los nodos.

Visión general

image.png

image.png

Filtrado por nodo

image.png

image.png

Historial

Databricks permite tomar capturas de un estado de un clúster y almacenar históricamente para consulta a su estado en un determinado punto del tiempo.

image.png

Links

Ganglia Metrics - Databricks Docs Ganglia OpenSource Project page

Monitoreo de Spark

Spark Cluster UI - Master

image.png

Información de los Clusters en Spark UI

Spark UI

Para monitorizar la actividad de los clusters en nivel de jobs o procesos individuales. image.png

⚠️ **GitHub.com Fallback** ⚠️