Big Data Days 2021

Online Edition

28-30 Cентября

онлайн

Евгений Бурнаев

Доцент

Россия, Skoltech

Биография

Доцент Центра Сколтеха по научным и инженерным вычислительным технологиям для задач с большими массивами данных, канд. физ.-мат. наук. В 2006 году получил степень магистра прикладной физики и математики МФТИ. После защиты диссертации в 2008 году работал в ИППИ РАН руководителем лаборатории интеллектуального анализа данных и предсказательного моделирования. С 2007 года принимал участие в ряде проектов с такими компаниями, как Airbus, SAFT, IHI, Sahara Force India Formula 1 team, и др.
В настоящее время Евгений руководит научной группой Advanced Data Analytics in Science and Engineering в Сколтехе и специализируется на разработке методов машинного обучения для генеративных моделей и моделирования многообразий, с приложениями в задачах геометрического компьютерного зрения и обработки данных нейровизуализации.

В 2017 г. Евгений Бурнаев стал лауреатом премии Правительства Москвы молодым ученым в номинации «Передача, хранение, обработка, защита информации» за научный вклад и руководство проектом «Разработка методов предсказательной аналитики в задачах обработки индустриальных, биомедицинских и экономических данных».

Доклад

Оптимизация Нейросетевой Архитектуры Агента, Выполняющего Обучение с Подкреплением

Обучение с подкреплением (RL) за последние годы достигло значительного прогресса.
Одним из наиболее важных продвижений стало широкое использование нейросетевых архитектур для
моделирования агентов, выполняющих обучение с подкреплением.
Однако архитектуры этих нейронных сетей, как правило, выбираются вручную исследователем.
В данном докладе мы показываем, как недавно предложенные методы поиска нейросетевых архитектур (Neural Architecture Search, NAS) можно использовать для оптимизации архитектуры агентов RL.
Мы провели эксперименты на тестовом наборе задач Atari и выяснили, что современные
методы NAS действительно позволяют порождать более эффективные нейросетевые архитектуры агентов RL,
превосходящие архитектуры, выбранные вручную.

Ключевые слова

Reinforcement Learning
Neural Architecture Search
Atari Benchmark

« Hазад