Обзор последних работ (2014-2016) по обучению с подкреплением

Докладчики рассмотрят методы работы с непрерывным пространством действий на конкретных примерах и методы улучшения сходимости алгоритма Q-learning.