Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Introducción a Apache Airflow | Sección
Practice
Projects
Quizzes & Challenges
Cuestionarios
Challenges
/
Fundamentos de MLOps

bookIntroducción a Apache Airflow

Note
Definición

Apache Airflow es una plataforma para la orquestación de flujos de trabajo complejos: automatiza y programa tareas interdependientes en canalizaciones de datos y aprendizaje automático.

Airflow organiza los flujos de trabajo como Grafos Acíclicos Dirigidos (DAGs), donde cada nodo representa una tarea y los bordes definen las dependencias entre ellas. Esto garantiza que cada tarea se ejecute en el orden correcto; por ejemplo, un paso de entrenamiento de modelo solo puede comenzar después de que finalice el preprocesamiento de datos.

El planificador de Airflow ejecuta automáticamente estas tareas según un cronograma definido, asegurando consistencia y reproducibilidad. Los ingenieros pueden volver a ejecutar fácilmente tareas fallidas, monitorear el progreso a través de la interfaz de usuario de Airflow y escalar los flujos de trabajo a medida que los proyectos crecen.

Note
Estudiar más

Airflow permite flujos de trabajo reproducibles y automatizados para tareas de datos y aprendizaje automático. Consulta la documentación oficial de Airflow y ejemplos de la comunidad para profundizar en la orquestación de flujos de trabajo en entornos de producción.

Ejemplo básico de DAG

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Nota

Airflow es la base de la orquestación de flujos de trabajo en MLOps. Permite automatizar el reentrenamiento, la ingesta de datos y la evaluación, todo definido como código Python y ejecutado en orden.

Note
Estudiar más

Consulta la documentación oficial de Airflow para ejemplos de DAGs en producción y consejos sobre cómo escalar implementaciones de Airflow.

question mark

¿Qué representa un Grafo Acíclico Dirigido (DAG) en Airflow?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 11

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

bookIntroducción a Apache Airflow

Desliza para mostrar el menú

Note
Definición

Apache Airflow es una plataforma para la orquestación de flujos de trabajo complejos: automatiza y programa tareas interdependientes en canalizaciones de datos y aprendizaje automático.

Airflow organiza los flujos de trabajo como Grafos Acíclicos Dirigidos (DAGs), donde cada nodo representa una tarea y los bordes definen las dependencias entre ellas. Esto garantiza que cada tarea se ejecute en el orden correcto; por ejemplo, un paso de entrenamiento de modelo solo puede comenzar después de que finalice el preprocesamiento de datos.

El planificador de Airflow ejecuta automáticamente estas tareas según un cronograma definido, asegurando consistencia y reproducibilidad. Los ingenieros pueden volver a ejecutar fácilmente tareas fallidas, monitorear el progreso a través de la interfaz de usuario de Airflow y escalar los flujos de trabajo a medida que los proyectos crecen.

Note
Estudiar más

Airflow permite flujos de trabajo reproducibles y automatizados para tareas de datos y aprendizaje automático. Consulta la documentación oficial de Airflow y ejemplos de la comunidad para profundizar en la orquestación de flujos de trabajo en entornos de producción.

Ejemplo básico de DAG

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Nota

Airflow es la base de la orquestación de flujos de trabajo en MLOps. Permite automatizar el reentrenamiento, la ingesta de datos y la evaluación, todo definido como código Python y ejecutado en orden.

Note
Estudiar más

Consulta la documentación oficial de Airflow para ejemplos de DAGs en producción y consejos sobre cómo escalar implementaciones de Airflow.

question mark

¿Qué representa un Grafo Acíclico Dirigido (DAG) en Airflow?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 11
some-alt