Escritura y Ejecución de Código Python
Desliza para mostrar el menú
Python es un lenguaje principal en Databricks utilizado para manipulación de datos, aprendizaje automático y automatización. Los notebooks de Databricks ofrecen un entorno interactivo donde el código Python se escribe en celdas y se ejecuta en un clúster conectado.
Ahora que tu notebook está creado y conectado a un clúster, puedes comenzar a escribir y ejecutar código. Dado que los notebooks de Databricks están inspirados en Jupyter, la experiencia resultará familiar si has utilizado otros entornos de programación.
Comprensión de las celdas
El bloque fundamental de un notebook es la celda. Puedes tener tantas celdas como desees en un solo notebook. Para crear una nueva celda, coloca el cursor en la parte superior o inferior de una celda existente y haz clic en el icono "+" junto a la opción de Código o Texto, estableciendo así una celda de tu elección.
- Entrada: se escribe el código Python en el cuadro gris;
- Salida: una vez ejecutado, los resultados (como tablas de datos, texto impreso o mensajes de error) aparecen directamente debajo de esa celda específica.
Ejecución de código
Existen tres formas principales de ejecutar una celda de Python en Databricks:
- El ícono de reproducir: hacer clic en el ícono "Run Cell" (triángulo) en la esquina superior derecha de la celda;
- Shift + Enter: ejecuta la celda actual y mueve automáticamente el cursor a la siguiente celda (o crea una nueva);
- Ctrl + Enter (Cmd + Enter en Mac): ejecuta la celda actual y mantiene el cursor dentro de ella. Esto es útil cuando se prueba y vuelve a probar el mismo bloque de código.
Un ejercicio sencillo de Python
En el video viste cómo trabajar con variables. Aquí tienes un ejemplo más interesante para comprobar que tu entorno funciona: realizar un cálculo sencillo. Copia el siguiente código en una celda:
12345678910# Defining the variables price = 100 quantity = 5 tax_rate = 0.1 # Performing the calculation total_cost = (price * quantity) * (1 + tax_rate) # Printing the result print(f"The total cost of the items is: ${total_cost}")
Cuando ejecutes esta celda, el clúster procesará las variables y mostrará el texto: The total cost of the items is: $550.0.
Trabajo con variables entre celdas
Una característica clave de Databricks es la persistencia de estado. Esto significa que si defines una variable en una celda, permanece disponible en todas las celdas siguientes de ese notebook mientras el clúster esté en funcionamiento.
Por ejemplo, si creas una nueva celda debajo de la anterior y simplemente escribes print(total_cost), aún recordará que el valor era 550.0. Si reinicias el clúster o seleccionas "Clear State", deberás ejecutar nuevamente las celdas desde el principio para volver a inicializar esas variables.
Comentarios y documentación
En las celdas de Python, cualquier línea que comience con # es un comentario. Estos son ignorados por el clúster, pero son esenciales para explicar la lógica a los compañeros de equipo. El uso de comentarios permite mantener estándares profesionales de código dentro del entorno colaborativo del Workspace.
1. ¿Qué atajo de teclado te permite ejecutar una celda y permanecer en esa misma celda?
2. ¿Qué sucede con una variable definida en la Celda 1 cuando intentas usarla en la Celda 2?
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla