Big Data Days 2019

 8-10 октября   Москва

Валентина Джорджевич

Things Solver, Сербия

Дата

8 октября, 2019

}

Время проведения

10:00-17:00

Язык проведения

Aнглийский

Биография

Валентина — страстный энтузиаст анализа и обработки данных. Она работает аналитиком данных в компании Things Solver с октября 2016. У нее имеется степень бакалавра в области информационных систем и технологий, и степень магистра в области интеллектуальной обработки данных в университете Белграда на факультете организационных наук. Основные направления исследований, на которых она сосредотачивается — анализ временных рядов и методы обнаружения аномалий. Она обладает значительными техническими знаниями в сфере анализа и обработки данных, включая программирование (Java, Python, SQL, ETL), статистику (описательная статистика, проверка гипотез, теория вероятностей), моделирование (алгоритмы машинного обучения — на основе ансамблей, нейронные сети, на основе сходства) и визуализацию (Matplotlib, Seaborn, Plotly, Tableau). Она работает над различными проблемами в области анализа и обработки данных в различных областях бизнеса, от телекоммуникаций до розничной торговли, финансов и банковского дела, где она решает задачи, связанные с прогнозированием, профилактическим обслуживанием, обнаружением аномалий, сегментацией, прогнозированием оттока клиентов, определением круга потенциальных потребителей, балльной оценкой и т. д.

Мастер-класс

Методы машинного обучения для обнаружения аномалий

Этот мастер-класс посвящён методам машинного обучения, которые можно использовать для обнаружения аномалий. Сессия будет проходить в три этапа, каждый из которых является более углубленным, чем предыдущий.

Этап 1 включает в себя теоретическое введение в обнаружение аномалий и охватывает основные методы обнаружения аномалий, такие как z-оценка и сглаженная z-оценка для обнаружения аномалий.

Этап 2 включает в себя более продвинутые алгоритмы машинного обучения, способные работать с многомерными наборами данных, такие как изолирующий лес и метод эллиптической огибающей.

Этап 3 включает в себя использование нейросети – автоэнкодера для обнаружения аномалий в больших многомерных наборах данных.

Программа

  • Введение в анализ для обнаружения аномалий
  • Методы обнаружения аномалий
  • Z-оценка и сглаженная z-оценка для обнаружения аномалий
  • Изолирующий лес для обнаружения аномалий
  • Метод эллиптической огибающей для обнаружения аномалий
  • Автоэнкодер для обнаружения аномалий

Цели

Основная цель этого семинара заключается в том, чтобы познакомить участников с методами машинного обучения, используемыми в области обнаружения аномалий. После семинара участники должны быть в состоянии применять методы на практике с реальными данными.

Целевая аудитория

Целевая аудитория включает новичков и поклонников обработки и анализа данных, стремящихся изучить основы обнаружения аномалий.

Предварительные условия курса

Технические требования:

  • Среда Anaconda с Python 3.7
  • Библиотеки Python: sklearn, keras
  • TensorFlow