Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Johdanto Apache Airflow'hun | Osio
Mlopsin Perusteet

bookJohdanto Apache Airflow'hun

Note
Määritelmä

Apache Airflow on alusta monimutkaisten työnkulkujen orkestrointiin — riippuvaisten tehtävien automatisointiin ja ajoittamiseen data- ja koneoppimisputkissa.

Airflow järjestää työnkulut suunnattuina syklittöminä graafeina (DAG), joissa jokainen solmu edustaa tehtävää ja reunat määrittävät niiden väliset riippuvuudet. Tämä varmistaa, että jokainen tehtävä suoritetaan oikeassa järjestyksessä — esimerkiksi mallin koulutusvaihe voi alkaa vasta, kun datan esikäsittely on valmis.

Airflown ajastin suorittaa nämä tehtävät automaattisesti määritellyn aikataulun mukaisesti, mikä takaa johdonmukaisuuden ja toistettavuuden. Insinöörit voivat helposti suorittaa epäonnistuneet tehtävät uudelleen, seurata etenemistä Airflow-käyttöliittymässä ja laajentaa työnkulkuja projektien kasvaessa.

Note
Opiskele lisää

Airflow mahdollistaa toistettavat, automatisoidut työnkulut data- ja koneoppimistehtäville. Tutustu viralliseen Airflow-dokumentaatioon ja yhteisön esimerkkeihin syventääksesi ymmärrystäsi työnkulkujen orkestroinnista tuotantoympäristöissä.

Perus DAG-esimerkki

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Huomio

Airflow on työnkulkujen orkestroinnin selkäranka MLOpsissa. Sen avulla voidaan automatisoida uudelleenkoulutus, datan sisäänluku ja arviointi — kaikki määritelty Python-koodina ja suoritettu järjestyksessä.

Note
Lisätietoa

Tutustu viralliseen Airflow-dokumentaatioon esimerkkeihin tuotantotason DAG:eista ja vinkkeihin Airflow-ympäristöjen skaalaamiseen.

question mark

Mitä Directed Acyclic Graph (DAG) edustaa Airflow'ssa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 11

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookJohdanto Apache Airflow'hun

Pyyhkäise näyttääksesi valikon

Note
Määritelmä

Apache Airflow on alusta monimutkaisten työnkulkujen orkestrointiin — riippuvaisten tehtävien automatisointiin ja ajoittamiseen data- ja koneoppimisputkissa.

Airflow järjestää työnkulut suunnattuina syklittöminä graafeina (DAG), joissa jokainen solmu edustaa tehtävää ja reunat määrittävät niiden väliset riippuvuudet. Tämä varmistaa, että jokainen tehtävä suoritetaan oikeassa järjestyksessä — esimerkiksi mallin koulutusvaihe voi alkaa vasta, kun datan esikäsittely on valmis.

Airflown ajastin suorittaa nämä tehtävät automaattisesti määritellyn aikataulun mukaisesti, mikä takaa johdonmukaisuuden ja toistettavuuden. Insinöörit voivat helposti suorittaa epäonnistuneet tehtävät uudelleen, seurata etenemistä Airflow-käyttöliittymässä ja laajentaa työnkulkuja projektien kasvaessa.

Note
Opiskele lisää

Airflow mahdollistaa toistettavat, automatisoidut työnkulut data- ja koneoppimistehtäville. Tutustu viralliseen Airflow-dokumentaatioon ja yhteisön esimerkkeihin syventääksesi ymmärrystäsi työnkulkujen orkestroinnista tuotantoympäristöissä.

Perus DAG-esimerkki

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Huomio

Airflow on työnkulkujen orkestroinnin selkäranka MLOpsissa. Sen avulla voidaan automatisoida uudelleenkoulutus, datan sisäänluku ja arviointi — kaikki määritelty Python-koodina ja suoritettu järjestyksessä.

Note
Lisätietoa

Tutustu viralliseen Airflow-dokumentaatioon esimerkkeihin tuotantotason DAG:eista ja vinkkeihin Airflow-ympäristöjen skaalaamiseen.

question mark

Mitä Directed Acyclic Graph (DAG) edustaa Airflow'ssa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 11
some-alt