Вступ до навчання з підкріпленням
Курс
180 Вже зареєстровані учні- Процес навчання агентів через спроби та помилки із використанням винагород і зворотного зв'язку.
- Моделювання середовищ за допомогою марковських процесів прийняття рішень і розв'язання базових задач прийняття рішень.
- Роль дослідження в навчанні на прикладі багаторуких бандитів.
- Різні стратегії навчання: динамічне програмування, методи Монте-Карло, навчання з часовою різницею.
Довіряють працівники провідних компаній
Поділіться цим у соціальних мережах та у своєму огляді продуктивності
Є 5 модулі в цьому курсі
Навчання з підкріпленням (RL) — це потужний напрям машинного навчання, зосереджений на тренуванні інтелектуальних агентів шляхом взаємодії з навколишнім середовищем. У цьому курсі ви дізнаєтеся, як агенти поступово знаходять ефективні стратегії через спроби та помилки. Починаючи з основних понять, таких як марковські процеси прийняття рішень і багаторукі бандити, ви ознайомитеся з динамічним програмуванням, методами Монте-Карло та навчанням з часовою різницею.- Що таке RL?Попередній перегляд
- Підкріплювальне навчання проти інших парадигм навчанняПопередній перегляд
- Марковський процес прийняття рішеньПопередній перегляд
- Епізоди та ВинагородиПопередній перегляд
- Модель, Політика та ЗначенняПопередній перегляд
- Дослідження проти ВикористанняПопередній перегляд
- Основи GymnasiumПопередній перегляд
- Завдання: Налаштування СередовищаПопередній перегляд
- Що таке динамічне програмування?Попередній перегляд
- Рівняння БеллманаПопередній перегляд
- Умови ОптимальностіПопередній перегляд
- Оцінювання ПолітикиПопередній перегляд
- Поліпшення ПолітикиПопередній перегляд
- Узагальнена Ітерація ПолітикиПопередній перегляд
- Ітерація політикиПопередній перегляд
- Ітерація ЗначеньПопередній перегляд
- Завдання: Динамічне ПрограмуванняПопередній перегляд
- Що Таке Методи Монте-Карло?Попередній перегляд
- Оцінювання Функції ЦінностіПопередній перегляд
- Керування методом Монте-КарлоПопередній перегляд
- Підходи до ДослідженняПопередній перегляд
- Керування Монте-Карло на ПолітиціПопередній перегляд
- Off-Policy Керування Методом Монте-КарлоПопередній перегляд
- Інкрементні РеалізаціїПопередній перегляд
- Завдання: Методи Монте-КарлоПопередній перегляд
- Що таке навчання з часовою різницею?Попередній перегляд
- TD(0): Оцінювання Функції ЦінностіПопередній перегляд
- SARSA: Навчання з Часовою Різницею на ПолітиціПопередній перегляд
- Q-Навчання: Позаполітичне TD-НавчанняПопередній перегляд
- Узагальнення TD-НавчанняПопередній перегляд
- Завдання: Навчання з Часовою РізницеюПопередній перегляд
З нами навчаються студенти найкращих університетів світу
Чому люди обирають Codefinity для своєї кар'єри

Kwizera Mugisha
The teaching methodology at Codefinity is excellent, and I particularly appreciate how it has prepared me to handle real-world coding problems. Currently, I am delving into Node.js and eagerly anticipate building full-stack projects that integrate all the knowledge I have gained.

Sherry Barnes-Fox
My first course was 4 hours, I did it in a few days, "nugget-style. The instructions are very clear and easy to understand. There is even a hint to help you get the answer, and if you still cannot get the answer, then you can display the answer. I love the learning style that is used, it engages me.

Bill Wagner
I have really liked the browser-based lessons that allow me to code within the lesson. The RUN button allows me to test the code I write before submitting for a grade.

Stephanie Chan
As I went through the first course of the Python track, I liked the way the course was lay out (in easy and digestible modules) with little exercises at the end of each concept.

Daniel Chinea
I have gained a lot of practical and logical thinking skills, along with patience for myself and confidence in myself that I can learn programming.

Steve Bruening
The learning was progressive and made it easy to follow along and make progress. I could feel my skills increasing and building on each other as the course went along.
Рекомендовано, якщо ви зацікавлені в навчанні Python
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
курс
Реляційні Бази Даних та Нормалізація
курс
ML Introduction with scikit-learn
курс
Ультимативна Візуалізація з Python
курс
Databases in Python
курс
Introduction to NLP
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
курс
Реляційні Бази Даних та Нормалізація
курс
ML Introduction with scikit-learn
курс
Ультимативна Візуалізація з Python
курс
Databases in Python
курс
Introduction to NLP
Захоплюйтеся технічними навичками! Наш ШІ-асистент надає зворотний зв'язок у реальному часі, персоналізовані підказки та пояснення помилок, надаючи вам можливість вчитися з упевненістю.
Завдяки робочим просторам ви можете створювати та ділитися проектами безпосередньо на нашій платформі. Ми підготували шаблони для вашої зручності
Візьміть під контроль свій кар'єрний розвиток і почніть свій шлях до освоєння новітніх технологій
Проекти з реального світу підвищують ваш портфоліо, демонструючи практичні навички, щоб вразити потенційних роботодавців




Повний доступ до каталогу
Одна підписка відкриває цей курс і весь наш каталог проектів і навичок.Ваша підписка також включає:
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
курс
Реляційні Бази Даних та Нормалізація
курс
ML Introduction with scikit-learn
курс
Ультимативна Візуалізація з Python
курс
Databases in Python
курс
Introduction to NLP
курс
Вступ до SQL
курс
Розширений Рівень SQL
курс
Перші Кроки з Pandas
курс
Excel Formulas
курс
Advanced Techniques in pandas
курс
Ultimate NumPy
курс
Introduction to Neural Networks
курс
Реляційні Бази Даних та Нормалізація
курс
ML Introduction with scikit-learn
курс
Ультимативна Візуалізація з Python
курс
Databases in Python
курс
Introduction to NLP
Часті запитання
Ще є запитання?
Напишіть ваше запитання тут