Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Introdução ao Apache Airflow | Seção
Fundamentos de MLOps

bookIntrodução ao Apache Airflow

Note
Definição

Apache Airflow é uma plataforma para orquestração de fluxos de trabalho complexos — automatizando e agendando tarefas interdependentes em pipelines de dados e machine learning.

O Airflow organiza fluxos de trabalho como Grafos Acíclicos Direcionados (DAGs), onde cada representa uma tarefa e as arestas definem as dependências entre elas. Isso garante que cada tarefa seja executada na ordem correta — por exemplo, uma etapa de treinamento de modelo só pode iniciar após a conclusão do pré-processamento dos dados.

O agendador do Airflow executa automaticamente essas tarefas conforme um cronograma definido, assegurando consistência e reprodutibilidade. Engenheiros podem facilmente reexecutar tarefas com falha, monitorar o progresso pela interface do Airflow e escalar fluxos de trabalho conforme os projetos crescem.

Note
Estude mais

O Airflow possibilita fluxos de trabalho reprodutíveis e automatizados para tarefas de dados e ML. Explore a documentação oficial do Airflow e exemplos da comunidade para aprofundar o entendimento sobre orquestração de fluxos de trabalho em ambientes de produção.

Exemplo Básico de DAG

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Nota

Airflow é a base da orquestração de workflows em MLOps. Permite automatizar o re-treinamento, ingestão de dados e avaliação — tudo definido como código Python e executado em ordem.

Note
Estude Mais

Confira a documentação oficial do Airflow para exemplos de DAGs em produção e dicas sobre como escalar implantações do Airflow.

question mark

O que um Grafo Acíclico Direcionado (DAG) representa no Airflow?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 11

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

bookIntrodução ao Apache Airflow

Deslize para mostrar o menu

Note
Definição

Apache Airflow é uma plataforma para orquestração de fluxos de trabalho complexos — automatizando e agendando tarefas interdependentes em pipelines de dados e machine learning.

O Airflow organiza fluxos de trabalho como Grafos Acíclicos Direcionados (DAGs), onde cada representa uma tarefa e as arestas definem as dependências entre elas. Isso garante que cada tarefa seja executada na ordem correta — por exemplo, uma etapa de treinamento de modelo só pode iniciar após a conclusão do pré-processamento dos dados.

O agendador do Airflow executa automaticamente essas tarefas conforme um cronograma definido, assegurando consistência e reprodutibilidade. Engenheiros podem facilmente reexecutar tarefas com falha, monitorar o progresso pela interface do Airflow e escalar fluxos de trabalho conforme os projetos crescem.

Note
Estude mais

O Airflow possibilita fluxos de trabalho reprodutíveis e automatizados para tarefas de dados e ML. Explore a documentação oficial do Airflow e exemplos da comunidade para aprofundar o entendimento sobre orquestração de fluxos de trabalho em ambientes de produção.

Exemplo Básico de DAG

from datetime import datetime, timedelta
from airflow import DAG
from airflow.operators.python import PythonOperator

def print_hello():
    print("Hello from Airflow DAG!")

default_args = {
    "owner": "mlops_engineer",
    "retries": 1,
    "retry_delay": timedelta(minutes=5),
}

dag = DAG(
    "hello_airflow_example",
    default_args=default_args,
    description="A simple DAG example",
    schedule_interval=timedelta(days=1),
    start_date=datetime(2024, 6, 1),
    catchup=False,
)

hello_task = PythonOperator(
    task_id="say_hello",
    python_callable=print_hello,
    dag=dag,
)
Note
Nota

Airflow é a base da orquestração de workflows em MLOps. Permite automatizar o re-treinamento, ingestão de dados e avaliação — tudo definido como código Python e executado em ordem.

Note
Estude Mais

Confira a documentação oficial do Airflow para exemplos de DAGs em produção e dicas sobre como escalar implantações do Airflow.

question mark

O que um Grafo Acíclico Direcionado (DAG) representa no Airflow?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 11
some-alt