Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Introduction à Apache Airflow | Section
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Fondamentaux du MLOps

bookIntroduction à Apache Airflow

Note
Définition

Apache Airflow est une plateforme permettant d'orchestrer des workflows complexes — automatisation et planification de tâches interdépendantes dans les pipelines de données et de machine learning.

Airflow organise les workflows sous forme de graphes orientés acycliques (DAGs), où chaque nœud représente une tâche et les arêtes définissent les dépendances entre elles. Cela garantit que chaque tâche s'exécute dans le bon ordre — par exemple, une étape d'entraînement de modèle ne peut commencer qu'après la fin du prétraitement des données.

Le planificateur d'Airflow exécute automatiquement ces tâches selon un calendrier défini, assurant cohérence et reproductibilité. Les ingénieurs peuvent facilement relancer les tâches échouées, surveiller la progression via l'interface Airflow, et faire évoluer les workflows à mesure que les projets grandissent.

Note
Approfondir

Airflow permet des workflows reproductibles et automatisés pour les tâches de données et de ML. Consulter la documentation officielle d'Airflow et les exemples de la communauté pour approfondir la compréhension de l'orchestration des workflows en environnement de production.

Exemple de DAG de base

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Note

Airflow constitue l’épine dorsale de l’orchestration des workflows en MLOps. Il permet d’automatiser la réentraînement, l’ingestion de données et l’évaluation — le tout défini en code Python et exécuté dans l’ordre.

Note
Approfondir

Consultez la documentation Airflow officielle pour des exemples de DAGs en production et des conseils sur la mise à l’échelle des déploiements Airflow.

question mark

Que représente un graphe orienté acyclique (DAG) dans Airflow ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 11

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

bookIntroduction à Apache Airflow

Glissez pour afficher le menu

Note
Définition

Apache Airflow est une plateforme permettant d'orchestrer des workflows complexes — automatisation et planification de tâches interdépendantes dans les pipelines de données et de machine learning.

Airflow organise les workflows sous forme de graphes orientés acycliques (DAGs), où chaque nœud représente une tâche et les arêtes définissent les dépendances entre elles. Cela garantit que chaque tâche s'exécute dans le bon ordre — par exemple, une étape d'entraînement de modèle ne peut commencer qu'après la fin du prétraitement des données.

Le planificateur d'Airflow exécute automatiquement ces tâches selon un calendrier défini, assurant cohérence et reproductibilité. Les ingénieurs peuvent facilement relancer les tâches échouées, surveiller la progression via l'interface Airflow, et faire évoluer les workflows à mesure que les projets grandissent.

Note
Approfondir

Airflow permet des workflows reproductibles et automatisés pour les tâches de données et de ML. Consulter la documentation officielle d'Airflow et les exemples de la communauté pour approfondir la compréhension de l'orchestration des workflows en environnement de production.

Exemple de DAG de base

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Note

Airflow constitue l’épine dorsale de l’orchestration des workflows en MLOps. Il permet d’automatiser la réentraînement, l’ingestion de données et l’évaluation — le tout défini en code Python et exécuté dans l’ordre.

Note
Approfondir

Consultez la documentation Airflow officielle pour des exemples de DAGs en production et des conseils sur la mise à l’échelle des déploiements Airflow.

question mark

Que représente un graphe orienté acyclique (DAG) dans Airflow ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 11
some-alt