Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Introduktion til Apache Airflow | Sektion
Practice
Projects
Quizzes & Challenges
Quizzer
Challenges
/
Mlops Grundlæggende

bookIntroduktion til Apache Airflow

Note
Definition

Apache Airflow er en platform til orkestrering af komplekse arbejdsgange — automatisering og planlægning af indbyrdes afhængige opgaver i data- og maskinlærings-pipelines.

Airflow organiserer arbejdsgange som Directed Acyclic Graphs (DAGs), hvor hver node repræsenterer en opgave, og kanterne definerer afhængigheder mellem dem. Dette sikrer, at hver opgave udføres i korrekt rækkefølge — for eksempel kan et modeltræningsskridt først starte, når datapræprocesseringen er afsluttet.

Airflows scheduler udfører automatisk disse opgaver efter en defineret tidsplan, hvilket sikrer konsistens og reproducerbarhed. Ingeniører kan nemt genkøre fejlede opgaver, overvåge fremdrift via Airflow UI og skalere arbejdsgange, efterhånden som projekter vokser.

Note
Læs mere

Airflow muliggør reproducerbare, automatiserede arbejdsgange for data- og ML-opgaver. Udforsk den officielle Airflow-dokumentation og eksempler fra fællesskabet for at uddybe din forståelse af workflow-orkestrering i produktionsmiljøer.

Grundlæggende DAG-eksempel

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Bemærk

Airflow er rygraden i workflow-orkestrering inden for MLOps. Det muliggør automatisering af gen-træning, dataindtagelse og evaluering — alt sammen defineret som Python-kode og udført i rækkefølge.

Note
Læs Mere

Se den officielle Airflow-dokumentation for eksempler på produktions-DAGs og tips til skalering af Airflow-implementeringer.

question mark

Hvad repræsenterer en Directed Acyclic Graph (DAG) i Airflow?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 11

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

bookIntroduktion til Apache Airflow

Stryg for at vise menuen

Note
Definition

Apache Airflow er en platform til orkestrering af komplekse arbejdsgange — automatisering og planlægning af indbyrdes afhængige opgaver i data- og maskinlærings-pipelines.

Airflow organiserer arbejdsgange som Directed Acyclic Graphs (DAGs), hvor hver node repræsenterer en opgave, og kanterne definerer afhængigheder mellem dem. Dette sikrer, at hver opgave udføres i korrekt rækkefølge — for eksempel kan et modeltræningsskridt først starte, når datapræprocesseringen er afsluttet.

Airflows scheduler udfører automatisk disse opgaver efter en defineret tidsplan, hvilket sikrer konsistens og reproducerbarhed. Ingeniører kan nemt genkøre fejlede opgaver, overvåge fremdrift via Airflow UI og skalere arbejdsgange, efterhånden som projekter vokser.

Note
Læs mere

Airflow muliggør reproducerbare, automatiserede arbejdsgange for data- og ML-opgaver. Udforsk den officielle Airflow-dokumentation og eksempler fra fællesskabet for at uddybe din forståelse af workflow-orkestrering i produktionsmiljøer.

Grundlæggende DAG-eksempel

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Bemærk

Airflow er rygraden i workflow-orkestrering inden for MLOps. Det muliggør automatisering af gen-træning, dataindtagelse og evaluering — alt sammen defineret som Python-kode og udført i rækkefølge.

Note
Læs Mere

Se den officielle Airflow-dokumentation for eksempler på produktions-DAGs og tips til skalering af Airflow-implementeringer.

question mark

Hvad repræsenterer en Directed Acyclic Graph (DAG) i Airflow?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 11
some-alt