Вступ до навчання з підкріпленням
Курс
180 Вже зареєстровані учні- Процес навчання агентів через спроби та помилки із використанням винагород і зворотного зв'язку.
- Моделювання середовищ за допомогою марковських процесів прийняття рішень і розв'язання базових задач прийняття рішень.
- Роль дослідження в навчанні на прикладі багаторуких бандитів.
- Різні стратегії навчання: динамічне програмування, методи Монте-Карло, навчання з часовою різницею.
Довіряють працівники провідних компаній
Поділіться цим у соціальних мережах та у своєму огляді продуктивності
Є 5 модулі в цьому курсі
Навчання з підкріпленням (RL) — це потужний напрям машинного навчання, зосереджений на тренуванні інтелектуальних агентів шляхом взаємодії з навколишнім середовищем. У цьому курсі ви дізнаєтеся, як агенти поступово знаходять ефективні стратегії через спроби та помилки. Починаючи з основних понять, таких як марковські процеси прийняття рішень і багаторукі бандити, ви ознайомитеся з динамічним програмуванням, методами Монте-Карло та навчанням з часовою різницею.- Що таке RL?Попередній перегляд
- Підкріплювальне навчання проти інших парадигм навчанняПопередній перегляд
- Марковський процес прийняття рішеньПопередній перегляд
- Епізоди та ВинагородиПопередній перегляд
- Модель, Політика та ЗначенняПопередній перегляд
- Дослідження проти ВикористанняПопередній перегляд
- Основи GymnasiumПопередній перегляд
- Завдання: Налаштування СередовищаПопередній перегляд
- Що таке динамічне програмування?Попередній перегляд
- Рівняння БеллманаПопередній перегляд
- Умови ОптимальностіПопередній перегляд
- Оцінювання ПолітикиПопередній перегляд
- Поліпшення ПолітикиПопередній перегляд
- Узагальнена Ітерація ПолітикиПопередній перегляд
- Ітерація політикиПопередній перегляд
- Ітерація ЗначеньПопередній перегляд
- Завдання: Динамічне ПрограмуванняПопередній перегляд
- Що Таке Методи Монте-Карло?Попередній перегляд
- Оцінювання Функції ЦінностіПопередній перегляд
- Керування методом Монте-КарлоПопередній перегляд
- Підходи до ДослідженняПопередній перегляд
- Керування Монте-Карло на ПолітиціПопередній перегляд
- Off-Policy Керування Методом Монте-КарлоПопередній перегляд
- Інкрементні РеалізаціїПопередній перегляд
- Завдання: Методи Монте-КарлоПопередній перегляд
- Що таке навчання з часовою різницею?Попередній перегляд
- TD(0): Оцінювання Функції ЦінностіПопередній перегляд
- SARSA: Навчання з Часовою Різницею на ПолітиціПопередній перегляд
- Q-Навчання: Позаполітичне TD-НавчанняПопередній перегляд
- Узагальнення TD-НавчанняПопередній перегляд
- Завдання: Навчання з Часовою РізницеюПопередній перегляд
З нами навчаються студенти найкращих університетів світу
Чому люди обирають Codefinity для своєї кар'єри

Kwizera Mugisha
The teaching methodology at Codefinity is excellent, and I particularly appreciate how it has prepared me to handle real-world coding problems. Currently, I am delving into Node.js and eagerly anticipate building full-stack projects that integrate all the knowledge I have gained.

Sherry Barnes-Fox
My first course was 4 hours, I did it in a few days, "nugget-style. The instructions are very clear and easy to understand. There is even a hint to help you get the answer, and if you still cannot get the answer, then you can display the answer. I love the learning style that is used, it engages me.

Bill Wagner
I have really liked the browser-based lessons that allow me to code within the lesson. The RUN button allows me to test the code I write before submitting for a grade.

Stephanie Chan
As I went through the first course of the Python track, I liked the way the course was lay out (in easy and digestible modules) with little exercises at the end of each concept.

Daniel Chinea
I have gained a lot of practical and logical thinking skills, along with patience for myself and confidence in myself that I can learn programming.

Steve Bruening
The learning was progressive and made it easy to follow along and make progress. I could feel my skills increasing and building on each other as the course went along.
Рекомендовано, якщо ви зацікавлені в навчанні Python
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
проєкт
Conducting Exploratory Data Analysis of Nobel Prizes
проєкт
Extracting Text Meaning using TF-IDF
проєкт
Recognizing Handwritten Digits
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
проєкт
Identifying the Most Frequent Words in Text
курс
Реляційні Бази Даних та Нормалізація
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
проєкт
Conducting Exploratory Data Analysis of Nobel Prizes
проєкт
Extracting Text Meaning using TF-IDF
проєкт
Recognizing Handwritten Digits
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
проєкт
Identifying the Most Frequent Words in Text
курс
Реляційні Бази Даних та Нормалізація
Захоплюйтеся технічними навичками! Наш ШІ-асистент надає зворотний зв'язок у реальному часі, персоналізовані підказки та пояснення помилок, надаючи вам можливість вчитися з упевненістю.
Завдяки робочим просторам ви можете створювати та ділитися проектами безпосередньо на нашій платформі. Ми підготували шаблони для вашої зручності
Візьміть під контроль свій кар'єрний розвиток і почніть свій шлях до освоєння новітніх технологій
Проекти з реального світу підвищують ваш портфоліо, демонструючи практичні навички, щоб вразити потенційних роботодавців




Повний доступ до каталогу
Одна підписка відкриває цей курс і весь наш каталог проектів і навичок.Ваша підписка також включає:
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
проєкт
Conducting Exploratory Data Analysis of Nobel Prizes
проєкт
Extracting Text Meaning using TF-IDF
проєкт
Recognizing Handwritten Digits
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
проєкт
Identifying the Most Frequent Words in Text
курс
Реляційні Бази Даних та Нормалізація
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
проєкт
Conducting Exploratory Data Analysis of Nobel Prizes
проєкт
Extracting Text Meaning using TF-IDF
проєкт
Recognizing Handwritten Digits
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
проєкт
Identifying the Most Frequent Words in Text
курс
Реляційні Бази Даних та Нормалізація
Часті запитання
Ще є запитання?
Напишіть ваше запитання тут