Машинное обучение с подкреплением на Python

Изучим взаимодействие среды и агенты, Q-обучение, Монте-Карло и Deep Q-Network
4.19 (8 reviews)
Udemy
platform
Русский
language
Data Science
category
Машинное обучение с подкреплением на Python
60
students
5.5 hours
content
Dec 2022
last update
$19.99
regular price

Why take this course?

🚀 Объявление о курсе:

Внимание, будущие знаторы машинного обучения! 🧐

Для тех, кто готов взлететь на новый уровень своих знаний и освоить все интерны машинного обучения с подкреплением на Python, здесь именно тук ваш полет начнется! 🛫

🚀 Курс "Машинное обучение с подкреплением на Python" от ITtensive:

Это не просто курс, это завершающий этап вашего пути в мире машинного обучения. В этом курсе вы узнаете и практически реализуете три фундаментальных задачи обучения с подкреплением:

  1. Игра в крестики-нолики (Tic-Tac-Toe) 🎲:

    • Создадите свою среду игры и агентов.
    • Разработайте стратегии, исследуйте уравнение Беллмана, Q-обучение и обучение с преследованием.
    • Проведите эксперименты со стратегиями жадного выбора и оптимизированных версий, чтобы увидеть их эффективность.
    • Ваш проект: создайте собственного выигрышного агента для игры в крестики-нолики!
  2. Задача балансировки тележки (CartPole) 🪫:

    • Изучите принципы построения DQN и примените их, чтобы научить агента управлять тележкой в физическом окружении.
    • Сравните обучение агента с использованием случайных процессов.
    • Разберетесь с априорными и постериорными вероятностями, эмулированием кратковременной и долговременной памяти.
    • Ваш проект: разработайте оптимизированную DQN для балансировки тележки!
  3. Игра в блекджек (21 очко) 🃌:

    • Применьте методы Монте-Карло, исследовательские старты и разделенную/единую политику для расчета оптимальных ходов в Блекджек.
    • Визуализируйте оптимальную стратегию игры через изоповерхности.
    • Ваш проект: рассчитайте и реализуйте оптимальную стратегию для игры в блекджек!

🔥 Теоретические основы, которые вы освоите:

  • Задачи машинного обучения и обучения с подкреплением.
  • Метрики и метрики обучения с подкреплением.
  • Проблема эксплуатации и разведки (Exploration vs. Exploitation).
  • Цепь случайных процессов Маркова (Markov Decision Processes, MDPs).
  • Принцип и уравнение Беллмана.
  • Методы Монте-Карло.
  • Q-таблица и Q-обучение.
  • Стратегии жадного выбора: эпсилон-жадная стратегия, её убывающая версия, UCB-стратегия и стратегия Томпсона.
  • Создание и обучение Deep Q-Network (DQN).
  • Концепции кратковременной и долговременной памяти в обучении.
  • Разработка единой и разделенной политик.

🔥 Почему это важно:

Обучение с подкреплением — это мощный инструмент машинного обучения, который позволяет системам учиться в динамических средах, принимать решения в реальном времени и адаптироваться к изменяющимся условиям. Эти навыки не только делают вас квалифицированным специалистом в области ИИ, но и открывают перед вами широкие возможности для работы во многих областях, от робототехники до разработки сложных алгоритмов игр.

📅 Перегляньте расписание и запишитесь на курс уже сейчас! Ваша карьера в области ИИ ждет вас! 🌟

Course Gallery

Машинное обучение с подкреплением на Python – Screenshot 1
Screenshot 1Машинное обучение с подкреплением на Python
Машинное обучение с подкреплением на Python – Screenshot 2
Screenshot 2Машинное обучение с подкреплением на Python
Машинное обучение с подкреплением на Python – Screenshot 3
Screenshot 3Машинное обучение с подкреплением на Python
Машинное обучение с подкреплением на Python – Screenshot 4
Screenshot 4Машинное обучение с подкреплением на Python

Loading charts...

4447568
udemy ID
16/12/2021
course created date
19/12/2021
course indexed date
Bot
course submited by
Машинное обучение с подкреплением на Python - | Comidoc