Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Gestión de Clústeres | Configuración del Espacio de Trabajo
Fundamentos de Databricks: Guía Para Principiantes

Gestión de Clústeres

Desliza para mostrar el menú

Note
Definición

La gestión de clústeres se refiere al proceso de controlar el ciclo de vida de los recursos de cómputo. Conocer cuándo iniciar, detener y reiniciar un clúster es fundamental para administrar el rendimiento y controlar los costos en la nube.

Ahora que sabes cómo crear un clúster, necesitas saber cómo gestionarlo. En la nube, se factura por cada segundo que un clúster está en estado "Running". Ser un ingeniero o analista de datos profesional implica no solo saber programar, sino también gestionar los recursos de manera eficiente para no desperdiciar el presupuesto de la empresa (o el propio).

Comprensión de los estados del clúster

Al observar la página de Compute, se pueden ver diferentes iconos de estado junto al nombre del clúster. Comprender estos iconos es fundamental para saber si es posible ejecutar código:

  • En ejecución (Círculo verde): el motor está activo y listo. Permite ejecutar notebooks y consultas de forma inmediata;
  • Terminado (Círculo gris): el motor está apagado. No genera costos, pero no se puede ejecutar código hasta que se inicie nuevamente;
  • Pendiente (Círculo giratorio): el clúster se está "preparando". El proveedor de la nube está asignando el hardware en este momento;
  • Reiniciando: el clúster se está apagando y encendiendo de inmediato, lo cual es útil si se ha cambiado una configuración.

Controles manuales: iniciar, detener y reiniciar

En el lado derecho de su clúster en la vista de lista, se pueden ver varios iconos de acción:

  • Botón de reproducción (Iniciar): se utiliza al comenzar la jornada laboral. Tarda aproximadamente 3 a 5 minutos en pasar de "Terminado" a "En ejecución.";
  • Botón cuadrado (Terminar/Detener): se utiliza al finalizar una tarea. Al hacer clic, se detiene inmediatamente el conteo de facturación. Importante: Terminar un clúster no elimina el trabajo ni los notebooks; simplemente apaga el "motor" y borra la memoria (por lo que las variables almacenadas en memoria se eliminarán, como sucedería al apagar una computadora).
  • La flecha circular (Reiniciar): si tu clúster se vuelve lento o has instalado una nueva biblioteca que requiere una actualización, utiliza el botón Reiniciar.

Editar vs. Clonar

A veces te das cuenta de que el "motor" que creaste no es del todo correcto.

  • Editar: puedes cambiar el tamaño de tu clúster o la versión del runtime haciendo clic en el nombre y seleccionando "Editar". Ten en cuenta que normalmente debes finalizar el clúster antes de poder guardar los cambios en su hardware;
  • Clonar: si te gusta tu configuración actual pero quieres un segundo clúster idéntico (quizás para otro proyecto), el botón "Clonar" te ahorra el tiempo de volver a completar todos los ajustes desde cero.

La regla de oro para ahorrar dinero

El clúster más caro es aquel que está "En ejecución" pero no está haciendo absolutamente nada. Siempre revisa tu pestaña de Compute antes de cerrar sesión al final del día. Si ves una luz verde y no estás ejecutando más código, haz clic en el botón Cuadrado (Detener). En el mundo del Big Data, "Detener" es tan importante como "Iniciar".

1. ¿"Terminar" un clúster elimina los notebooks que has escrito?

2. ¿Qué estado indica que el clúster se está iniciando y aún no está listo para ejecutar código?

3. Has terminado tu análisis por hoy. ¿Cuál es la mejor práctica para asegurarte de no incurrir en costos innecesarios en la nube durante la noche?

question mark

¿"Terminar" un clúster elimina los notebooks que has escrito?

Selecciona la respuesta correcta

question mark

¿Qué estado indica que el clúster se está iniciando y aún no está listo para ejecutar código?

Selecciona la respuesta correcta

question mark

Has terminado tu análisis por hoy. ¿Cuál es la mejor práctica para asegurarte de no incurrir en costos innecesarios en la nube durante la noche?

Selecciona la respuesta correcta

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 2. Capítulo 4
some-alt