Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Introduksjon til Apache Airflow | Seksjon
Practice
Projects
Quizzes & Challenges
Quizer
Challenges
/
MLOps-Grunnleggende

bookIntroduksjon til Apache Airflow

Note
Definisjon

Apache Airflow er en plattform for orkestrering av komplekse arbeidsflyter — automatisering og planlegging av avhengige oppgaver i data- og maskinlæringspipeliner.

Airflow organiserer arbeidsflyter som Directed Acyclic Graphs (DAGs), der hver node representerer en oppgave og kantene definerer avhengigheter mellom dem. Dette sikrer at hver oppgave kjøres i riktig rekkefølge — for eksempel kan et steg for modelltrening bare starte etter at dataprosesseringen er fullført.

Airflows scheduler utfører automatisk disse oppgavene i henhold til en definert tidsplan, noe som sikrer konsistens og reproduserbarhet. Ingeniører kan enkelt kjøre mislykkede oppgaver på nytt, overvåke fremdrift gjennom Airflow UI, og skalere arbeidsflyter etter hvert som prosjektene vokser.

Note
Les mer

Airflow muliggjør reproduserbare, automatiserte arbeidsflyter for data- og ML-oppgaver. Utforsk den offisielle Airflow-dokumentasjonen og eksempler fra fellesskapet for å utdype forståelsen av arbeidsflytorkestrering i produksjonsmiljøer.

Grunnleggende DAG-eksempel

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Merk

Airflow er ryggraden i arbeidsflyt-orkestrering innen MLOps. Det gjør det mulig å automatisere retrening, datainnhenting og evaluering — alt definert som Python-kode og utført i rekkefølge.

Note
Les mer

Se den offisielle Airflow-dokumentasjonen for eksempler på produksjons-DAG-er og tips om skalering av Airflow-installasjoner.

question mark

Hva representerer en Directed Acyclic Graph (DAG) i Airflow?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 11

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

bookIntroduksjon til Apache Airflow

Sveip for å vise menyen

Note
Definisjon

Apache Airflow er en plattform for orkestrering av komplekse arbeidsflyter — automatisering og planlegging av avhengige oppgaver i data- og maskinlæringspipeliner.

Airflow organiserer arbeidsflyter som Directed Acyclic Graphs (DAGs), der hver node representerer en oppgave og kantene definerer avhengigheter mellom dem. Dette sikrer at hver oppgave kjøres i riktig rekkefølge — for eksempel kan et steg for modelltrening bare starte etter at dataprosesseringen er fullført.

Airflows scheduler utfører automatisk disse oppgavene i henhold til en definert tidsplan, noe som sikrer konsistens og reproduserbarhet. Ingeniører kan enkelt kjøre mislykkede oppgaver på nytt, overvåke fremdrift gjennom Airflow UI, og skalere arbeidsflyter etter hvert som prosjektene vokser.

Note
Les mer

Airflow muliggjør reproduserbare, automatiserte arbeidsflyter for data- og ML-oppgaver. Utforsk den offisielle Airflow-dokumentasjonen og eksempler fra fellesskapet for å utdype forståelsen av arbeidsflytorkestrering i produksjonsmiljøer.

Grunnleggende DAG-eksempel

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Merk

Airflow er ryggraden i arbeidsflyt-orkestrering innen MLOps. Det gjør det mulig å automatisere retrening, datainnhenting og evaluering — alt definert som Python-kode og utført i rekkefølge.

Note
Les mer

Se den offisielle Airflow-dokumentasjonen for eksempler på produksjons-DAG-er og tips om skalering av Airflow-installasjoner.

question mark

Hva representerer en Directed Acyclic Graph (DAG) i Airflow?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 11
some-alt