Conteúdo do Curso
Introdução ao Aprendizado por Reforço
Introdução ao Aprendizado por Reforço
RL vs. Outros Paradigmas de Aprendizado
Aprendizado de máquina consiste em três principais paradigmas de aprendizado, cada um adequado para diferentes tipos de problemas. Aprendizado por reforço é um deles, juntamente com aprendizado supervisionado e aprendizado não supervisionado.
Principais Características do RL
- Sem dados rotulados: RL não requer pares de entrada-saída predefinidos, mas aprende a partir da experiência;
- Aprendizado por tentativa e erro: o agente explora diferentes ações e aprimora sua estratégia com base no feedback;
- Tomada de decisão sequencial: RL é projetado para tarefas em que as decisões atuais afetam resultados futuros;
- Maximização de recompensa: o objetivo do aprendizado é otimizar recompensas de longo prazo em vez de correção de curto prazo.
Comparação dos Três Paradigmas de ML
Por que o Aprendizado por Reforço é Diferente
O aprendizado por reforço compartilha algumas semelhanças com outros paradigmas, mas se destaca devido à sua abordagem única ao processo de aprendizagem.
Aprendizado Supervisionado
No aprendizado supervisionado, um conjunto de dados fornece instruções explícitas sobre qual deve ser a saída correta. No aprendizado por reforço, não há supervisão explícita—o agente deve descobrir as melhores ações por meio da experiência.
Aprendizado Não Supervisionado
O aprendizado não supervisionado identifica padrões ocultos nos dados sem objetivos específicos. O aprendizado por reforço aprende por meio da interação com um ambiente para alcançar um objetivo explícito (por exemplo, vencer um jogo).
Obrigado pelo seu feedback!