Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Introductie tot Apache Airflow | Sectie
Mlops Fundamentals

bookIntroductie tot Apache Airflow

Note
Definitie

Apache Airflow is een platform voor het orkestreren van complexe workflows — het automatiseren en plannen van onderling afhankelijke taken in data- en machine learning-pijplijnen.

Airflow organiseert workflows als Directed Acyclic Graphs (DAGs), waarbij elke node een taak vertegenwoordigt en de edges de afhankelijkheden daartussen definiëren. Dit zorgt ervoor dat elke taak in de juiste volgorde wordt uitgevoerd — bijvoorbeeld, een modeltraining kan pas starten nadat de datavoorbewerking is voltooid.

De scheduler van Airflow voert deze taken automatisch uit volgens een gedefinieerd schema, wat consistentie en reproduceerbaarheid waarborgt. Engineers kunnen eenvoudig mislukte taken opnieuw uitvoeren, de voortgang volgen via de Airflow UI en workflows opschalen naarmate projecten groeien.

Note
Meer leren

Airflow maakt reproduceerbare, geautomatiseerde workflows mogelijk voor data- en ML-taken. Raadpleeg de officiële Airflow-documentatie en communityvoorbeelden om uw begrip van workfloworkestratie in productieomgevingen te verdiepen.

Voorbeeld van een basis-DAG

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Opmerking

Airflow is de ruggengraat van workfloworkestratie in MLOps. Hiermee kan het hertrainen, data-inname en evaluatie worden geautomatiseerd — alles gedefinieerd als Python-code en in volgorde uitgevoerd.

Note
Meer leren

Bekijk de officiële Airflow-documentatie voor voorbeelden van productie-DAG's en tips voor het opschalen van Airflow-implementaties.

question mark

Wat stelt een Directed Acyclic Graph (DAG) voor in Airflow?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 11

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

bookIntroductie tot Apache Airflow

Veeg om het menu te tonen

Note
Definitie

Apache Airflow is een platform voor het orkestreren van complexe workflows — het automatiseren en plannen van onderling afhankelijke taken in data- en machine learning-pijplijnen.

Airflow organiseert workflows als Directed Acyclic Graphs (DAGs), waarbij elke node een taak vertegenwoordigt en de edges de afhankelijkheden daartussen definiëren. Dit zorgt ervoor dat elke taak in de juiste volgorde wordt uitgevoerd — bijvoorbeeld, een modeltraining kan pas starten nadat de datavoorbewerking is voltooid.

De scheduler van Airflow voert deze taken automatisch uit volgens een gedefinieerd schema, wat consistentie en reproduceerbaarheid waarborgt. Engineers kunnen eenvoudig mislukte taken opnieuw uitvoeren, de voortgang volgen via de Airflow UI en workflows opschalen naarmate projecten groeien.

Note
Meer leren

Airflow maakt reproduceerbare, geautomatiseerde workflows mogelijk voor data- en ML-taken. Raadpleeg de officiële Airflow-documentatie en communityvoorbeelden om uw begrip van workfloworkestratie in productieomgevingen te verdiepen.

Voorbeeld van een basis-DAG

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Opmerking

Airflow is de ruggengraat van workfloworkestratie in MLOps. Hiermee kan het hertrainen, data-inname en evaluatie worden geautomatiseerd — alles gedefinieerd als Python-code en in volgorde uitgevoerd.

Note
Meer leren

Bekijk de officiële Airflow-documentatie voor voorbeelden van productie-DAG's en tips voor het opschalen van Airflow-implementaties.

question mark

Wat stelt een Directed Acyclic Graph (DAG) voor in Airflow?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 11
some-alt