Introdução ao Aprendizado por Reforço
Curso
180 Alunos já inscritos- Processo de aprendizagem de agentes por tentativa e erro utilizando recompensas e feedback.
- Modelagem de ambientes com processos de decisão de Markov e resolução de problemas básicos de decisão.
- Importância da exploração no aprendizado, sob a perspectiva de problemas de múltiplos braços.
- Estratégias de aprendizado distintas: programação dinâmica, métodos de Monte Carlo e aprendizado por diferença temporal.
Confiado por funcionários de empresas líderes
Compartilhe nas redes sociais e na sua avaliação de desempenho
Existem 5 módulos neste curso
O Aprendizado por Reforço (RL) é um ramo poderoso do aprendizado de máquina focado no treinamento de agentes inteligentes por meio da interação com seu ambiente. Neste curso, você aprenderá como os agentes descobrem gradualmente comportamentos eficazes através de tentativa e erro. Começando com conceitos fundamentais como processos de decisão de Markov e multi-armed bandits, você avançará por programação dinâmica, métodos de Monte Carlo e aprendizado por diferença temporal.- O Que É RL?Pré-visualização
- RL vs. Outros Paradigmas de AprendizadoPré-visualização
- Processo de Decisão de MarkovPré-visualização
- Episódios e RetornosPré-visualização
- Modelo, Política e ValoresPré-visualização
- Exploração vs ExploraçãoPré-visualização
- Noções Básicas de GymnasiumPré-visualização
- Desafio: Configurando um AmbientePré-visualização
- O Que É Programação Dinâmica?Pré-visualização
- Equações de BellmanPré-visualização
- Condições de OtimalidadePré-visualização
- Avaliação de PolíticaPré-visualização
- Melhoria de PolíticaPré-visualização
- Iteração de Política GeneralizadaPré-visualização
- Iteração de PolíticaPré-visualização
- Iteração de ValorPré-visualização
- Desafio: Programação DinâmicaPré-visualização
- O Que São Métodos de Monte Carlo?Pré-visualização
- Estimação da Função de ValorPré-visualização
- Controle de Monte CarloPré-visualização
- Abordagens de ExploraçãoPré-visualização
- Controle Monte Carlo On-PolicyPré-visualização
- Controle Monte Carlo Off-PolicyPré-visualização
- Implementações IncrementaisPré-visualização
- Desafio: Métodos de Monte CarloPré-visualização
- O Que É Aprendizado por Diferença Temporal?Pré-visualização
- TD(0): Estimativa da Função de ValorPré-visualização
- SARSA: Aprendizado TD On-PolicyPré-visualização
- Q-Learning: Aprendizado TD Off-PolicyPré-visualização
- Generalização do Aprendizado TDPré-visualização
- Desafio: Aprendizado por Diferença TemporalPré-visualização
Escolhido por estudantes das melhores escolas
Por que as pessoas escolhem o Codefinity para sua carreira

Kwizera Mugisha
The teaching methodology at Codefinity is excellent, and I particularly appreciate how it has prepared me to handle real-world coding problems. Currently, I am delving into Node.js and eagerly anticipate building full-stack projects that integrate all the knowledge I have gained.

Sherry Barnes-Fox
My first course was 4 hours, I did it in a few days, "nugget-style. The instructions are very clear and easy to understand. There is even a hint to help you get the answer, and if you still cannot get the answer, then you can display the answer. I love the learning style that is used, it engages me.

Bill Wagner
I have really liked the browser-based lessons that allow me to code within the lesson. The RUN button allows me to test the code I write before submitting for a grade.

Stephanie Chan
As I went through the first course of the Python track, I liked the way the course was lay out (in easy and digestible modules) with little exercises at the end of each concept.

Daniel Chinea
I have gained a lot of practical and logical thinking skills, along with patience for myself and confidence in myself that I can learn programming.

Steve Bruening
The learning was progressive and made it easy to follow along and make progress. I could feel my skills increasing and building on each other as the course went along.
Recomendado se você estiver interessado em aprender Python
curso
Introdução ao SQL
curso
SQL Intermediário
curso
Primeiros Passos com Pandas
curso
Excel Formulas
projeto
Conducting Exploratory Data Analysis of Nobel Prizes
projeto
Extracting Text Meaning using TF-IDF
projeto
Recognizing Handwritten Digits
curso
Advanced Techniques in pandas
curso
Ultimate NumPy
curso
Introduction to Neural Networks
projeto
Identifying the Most Frequent Words in Text
curso
Relational Database and Normalization
curso
Introdução ao SQL
curso
SQL Intermediário
curso
Primeiros Passos com Pandas
curso
Excel Formulas
projeto
Conducting Exploratory Data Analysis of Nobel Prizes
projeto
Extracting Text Meaning using TF-IDF
projeto
Recognizing Handwritten Digits
curso
Advanced Techniques in pandas
curso
Ultimate NumPy
curso
Introduction to Neural Networks
projeto
Identifying the Most Frequent Words in Text
curso
Relational Database and Normalization
Abrace a fascinação das habilidades tecnológicas! Nosso assistente de IA fornece feedback em tempo real, dicas personalizadas e explicações de erros, capacitando você a aprender com confiança.
Com os Espaços de Trabalho, você pode criar e compartilhar projetos diretamente em nossa plataforma. Preparamos modelos para sua conveniência
Assuma o controle do desenvolvimento de sua carreira e comece seu caminho para dominar as tecnologias mais recentes
Projetos do mundo real elevam seu portfólio, mostrando habilidades práticas para impressionar potenciais empregadores




Acesso completo ao catálogo
Uma assinatura abre este curso e todo o nosso catálogo de projetos e habilidades.Sua assinatura também inclui:
curso
Introdução ao SQL
curso
SQL Intermediário
curso
Primeiros Passos com Pandas
curso
Excel Formulas
projeto
Conducting Exploratory Data Analysis of Nobel Prizes
projeto
Extracting Text Meaning using TF-IDF
projeto
Recognizing Handwritten Digits
curso
Advanced Techniques in pandas
curso
Ultimate NumPy
curso
Introduction to Neural Networks
projeto
Identifying the Most Frequent Words in Text
curso
Relational Database and Normalization
curso
Introdução ao SQL
curso
SQL Intermediário
curso
Primeiros Passos com Pandas
curso
Excel Formulas
projeto
Conducting Exploratory Data Analysis of Nobel Prizes
projeto
Extracting Text Meaning using TF-IDF
projeto
Recognizing Handwritten Digits
curso
Advanced Techniques in pandas
curso
Ultimate NumPy
curso
Introduction to Neural Networks
projeto
Identifying the Most Frequent Words in Text
curso
Relational Database and Normalization
Perguntas frequentes
Ainda tem dúvidas?
Escreva sua pergunta aqui