книга

Алгоритмы обучения с подкреплением на Python : описание и разработка алгоритмов искусственного интеллекта

Здесь можно купить книгу "Алгоритмы обучения с подкреплением на Python : описание и разработка алгоритмов искусственного интеллекта" в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Автор: Андреа Лонца

Форматы: PDF

Издательство: ДМК Пресс

Год: 2020

Место издания: Москва

ISBN: 978-5-97060-855-5

Страниц: 287

Артикул: 95186

Возрастная маркировка: 16+

Электронная книга

999 ₽

Купить и скачать

Читать фрагмент

Аннотация

Краткая аннотация книги "Алгоритмы обучения с подкреплением на Python"

Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.

Содержание

Содержание книги "Алгоритмы обучения с подкреплением на Python : описание и разработка алгоритмов искусственного интеллекта"

Об авторе
Предисловие
Часть I. АЛГОРИТМЫ И ОКРУЖАЮЩИЕ СРЕДЫ
Глава 1. Ландшафт обучения с подкреплением
Введение в ОП
Элементы ОП
Применение ОП
Резюме
Вопросы
Для дальнейшего чтения
Глава 2. Реализация цикла ОП и OpenAI Gym
Настройка окружающей среды
OpenAI Gym и цикл ОП
Разработка моделей МО с помощью TensorFlow
Введение в TensorBoard
Типы окружающих сред ОП
Резюме
Вопросы
Для дальнейшего чтения
Глава 3. Решение задач методом динамического программирования
МППР
Классификация алгоритмов ОП
Динамическое программирование
Резюме
Вопросы
Для дальнейшего чтения
Часть II. БЕЗМОДЕЛЬНЫЕ АЛГОРИТМЫ ОП
Глава 4. Применение Q-обучения и алгоритма SARSA
Обучение без модели
TD-обучение
SARSA
Применение SARSA к игре Taxi-v2
Q-обучение
Применение Q-обучения к игре Taxi-v2
Резюме
Вопросы
Глава 5. Глубокая Q-сеть
Глубокие нейронные сети и Q-обучение
DQN
Применение DQN к игре Pong
Вариации на тему DQN
Резюме
Вопросы
Для дальнейшего чтения
Глава 6. Стохастическая оптимизация и градиенты стратегии
Методы градиента стратегии
Устройство алгоритма REINFORCE
REINFORCE с базой
Обучение алгоритма исполнитель–критик
Резюме
Вопросы
Для дальнейшего чтения
Глава 7. Реализация TRPO и PPO
Roboschool
Метод естественного градиента стратегии
Оптимизация стратегии в доверительной области
Проксимальная оптимизация стратегии
Резюме
Вопросы
Для дальнейшего чтения
Глава 8. Применения алгоритмов DDPG и TD3
Сочетание оптимизации градиента стратегии с Q-обучением
Алгоритм DDPG
Алгоритм TD3
Резюме
Вопросы
Для дальнейшего чтения
Часть III. ЗА ПРЕДЕЛАМИ БЕЗМОДЕЛЬНЫХ АЛГОРИТМОВ
Глава 9. ОП на основе модели
Методы на основе модели
Сочетание безмодельного и основанного на модели обучения
Применение алгоритма ME-TRPO к задаче об обратном маятнике
Резюме
Вопросы
Для дальнейшего чтения
Глава 10. Подражательное обучение и алгоритм DAgger
Технические требования
Подход на основе подражания
Игра Flappy Bird
Алгоритм агрегирования набора данных
Обратное обучение с подкреплением
Резюме
Вопросы
Для дальнейшего чтения
Глава 11. Оптимизация методом черного ящика
За рамками ОП
Основы эволюционных алгоритмов
Масштабируемые эволюционные стратегии
Применение масштабируемой ЭС к среде LunarLander
Резюме
Вопросы
Для дальнейшего чтения
Глава 12. Разработка алгоритма ESBAS
Исследование и использование
Подходы к исследованию
Алгоритм ESBAS
Резюме
Вопросы
Для дальнейшего чтения
Глава 13. Практические подходы к решению проблем ОП
Рекомендуемые практики глубокого ОП
Проблемы глубокого ОП
Передовые методы
ОП в реальном мире
Будущее ОП и его влияние на общество
Резюме
Вопросы
Для дальнейшего чтения
Ответы на вопросы
Предметный указатель

Отзывы

Все отзывы о книге Алгоритмы обучения с подкреплением на Python : описание и разработка алгоритмов искусственного интеллекта

Чтобы оставить отзыв, зарегистрируйтесь или войдите

С книгой "Алгоритмы обучения с подкреплением на Python" читают