Big Data Days 2019

 8-10 октября   Москва

Вадим Стрижов

Московский физико-технический институт, Россия

Биография

Вадим Викторович Стрижов: доктор физико-математических наук, профессор Московского физико-технического института, главный научный сотрудник Лаборатории машинного интеллекта МФТИ, главный редактор журнала “Машинное обучение и анализ данных”. Ведет для студентов МФТИ  курс “Моя первая научная публикация”. Курс соединяет в команды студентов, руководителей и экспертов для постановки и решения новых задач и выполнения экспериментов в области ИИ. Работает над проектами “Порождение и выбор моделей машинного интеллекта”, “Анализ физической активности человека по измерениям датчиков носимых устройств”.  

Доклад

Оценка оптимального объема выборки и выбор моделей машинного обучения

Обсуждаются методы выбора моделей машинного обучения для случая, когда у нас нет данных. Для построения моделей данные надо собрать. Эта работа требует значительных усилий и ресурсов. Особенно, если речь идет о медицине. Например, специальный анализ крови одного пациента стоит более трех тысяч евро. Принятые статистические методы оценки объема выборки требуют до пятисот пациентов. Только на сбор данных требуется потратить внушительную сумму. Однако, ее можно значительно уменьшить. Для этого нужен метод раннего прогнозирования оптимального объема выборки. На ранних этапах сбора он даст информацию о классе моделей, что не только позволит оценить затраты на сбор, но и может снизить необходимый объем данных и уменьшить расходы на их сбор.

Ключевые слова

Машинное обучение
Oценка оптимального объема выборки
Bыбор моделей