Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Problema dos Multi-Armed Bandits | Problema do Bandido de Múltiplos Braços
Introdução ao Aprendizado por Reforço
course content

Conteúdo do Curso

Introdução ao Aprendizado por Reforço

Introdução ao Aprendizado por Reforço

1. Teoria Central de RL
2. Problema do Bandido de Múltiplos Braços
3. Programação Dinâmica
4. Métodos de Monte Carlo
5. Aprendizado por Diferença Temporal

book
Desafio: Problema dos Multi-Armed Bandits

A partir deste ponto, você receberá desafios de programação no formato Jupyter Notebook. Caso saiba como configurar corretamente o ambiente para esses notebooks, sinta-se à vontade para fazê-lo. No entanto, recomendamos o uso do Google Colab, pois oferece diversas vantagens em relação aos notebooks Jupyter tradicionais. Leia este artigo para aprender como o Colab funciona.

Note
Nota

A verificação da correção da sua solução pode ser complexa e erros podem ocorrer. Caso esteja confiante de que sua solução está correta, mas ela foi marcada como incorreta, revise cuidadosamente a solução recomendada. Se ainda assim não identificar nenhum problema, tente implementar a solução recomendada em uma célula separada e execute-a.

Como abrir o notebook e realizar as tarefas?

Para abrir o notebook e concluir as tarefas, siga estes passos:

  1. Baixar o notebook: o botão de download está disponível na parte inferior desta página;
  2. Abrir o Google Colab: acesse o site e faça login com sua conta Google;
  3. Abrir o notebook: utilize File > Upload notebook ou File > Open notebook > Upload e selecione o arquivo baixado. Para continuar trabalhando após uma pausa, utilize File > Open notebook > Recent e localize seu notebook nessa janela;
  4. Seguir as instruções: o notebook contém instruções detalhadas para as tarefas. Leia-as antes de prosseguir;
  5. Receber a chave: após resolver cada tarefa, você receberá uma parte da chave necessária para concluir o capítulo. Insira essas partes em um quiz na parte inferior da página após finalizar o desafio para verificar se todas as tarefas foram concluídas.

Desafio

question-icon

Insira as partes da chave

1.
2.

3.

4.

5.
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 6

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

course content

Conteúdo do Curso

Introdução ao Aprendizado por Reforço

Introdução ao Aprendizado por Reforço

1. Teoria Central de RL
2. Problema do Bandido de Múltiplos Braços
3. Programação Dinâmica
4. Métodos de Monte Carlo
5. Aprendizado por Diferença Temporal

book
Desafio: Problema dos Multi-Armed Bandits

A partir deste ponto, você receberá desafios de programação no formato Jupyter Notebook. Caso saiba como configurar corretamente o ambiente para esses notebooks, sinta-se à vontade para fazê-lo. No entanto, recomendamos o uso do Google Colab, pois oferece diversas vantagens em relação aos notebooks Jupyter tradicionais. Leia este artigo para aprender como o Colab funciona.

Note
Nota

A verificação da correção da sua solução pode ser complexa e erros podem ocorrer. Caso esteja confiante de que sua solução está correta, mas ela foi marcada como incorreta, revise cuidadosamente a solução recomendada. Se ainda assim não identificar nenhum problema, tente implementar a solução recomendada em uma célula separada e execute-a.

Como abrir o notebook e realizar as tarefas?

Para abrir o notebook e concluir as tarefas, siga estes passos:

  1. Baixar o notebook: o botão de download está disponível na parte inferior desta página;
  2. Abrir o Google Colab: acesse o site e faça login com sua conta Google;
  3. Abrir o notebook: utilize File > Upload notebook ou File > Open notebook > Upload e selecione o arquivo baixado. Para continuar trabalhando após uma pausa, utilize File > Open notebook > Recent e localize seu notebook nessa janela;
  4. Seguir as instruções: o notebook contém instruções detalhadas para as tarefas. Leia-as antes de prosseguir;
  5. Receber a chave: após resolver cada tarefa, você receberá uma parte da chave necessária para concluir o capítulo. Insira essas partes em um quiz na parte inferior da página após finalizar o desafio para verificar se todas as tarefas foram concluídas.

Desafio

question-icon

Insira as partes da chave

1.
2.

3.

4.

5.
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 6
some-alt