Big Data Days 2019
8-10 октября
Москва
Валентина Джорджевич
Things Solver, Сербия
Дата
8 октября, 2019
Время проведения
10:00-17:00
Язык проведения
Aнглийский
Биография
Валентина — страстный энтузиаст анализа и обработки данных. Она работает аналитиком данных в компании Things Solver с октября 2016. У нее имеется степень бакалавра в области информационных систем и технологий, и степень магистра в области интеллектуальной обработки данных в университете Белграда на факультете организационных наук. Основные направления исследований, на которых она сосредотачивается — анализ временных рядов и методы обнаружения аномалий. Она обладает значительными техническими знаниями в сфере анализа и обработки данных, включая программирование (Java, Python, SQL, ETL), статистику (описательная статистика, проверка гипотез, теория вероятностей), моделирование (алгоритмы машинного обучения — на основе ансамблей, нейронные сети, на основе сходства) и визуализацию (Matplotlib, Seaborn, Plotly, Tableau). Она работает над различными проблемами в области анализа и обработки данных в различных областях бизнеса, от телекоммуникаций до розничной торговли, финансов и банковского дела, где она решает задачи, связанные с прогнозированием, профилактическим обслуживанием, обнаружением аномалий, сегментацией, прогнозированием оттока клиентов, определением круга потенциальных потребителей, балльной оценкой и т. д.
Мастер-класс
Методы машинного обучения для обнаружения аномалий
Этот мастер-класс посвящён методам машинного обучения, которые можно использовать для обнаружения аномалий. Сессия будет проходить в три этапа, каждый из которых является более углубленным, чем предыдущий.
Этап 1 включает в себя теоретическое введение в обнаружение аномалий и охватывает основные методы обнаружения аномалий, такие как z-оценка и сглаженная z-оценка для обнаружения аномалий.
Этап 2 включает в себя более продвинутые алгоритмы машинного обучения, способные работать с многомерными наборами данных, такие как изолирующий лес и метод эллиптической огибающей.
Этап 3 включает в себя использование нейросети – автоэнкодера для обнаружения аномалий в больших многомерных наборах данных.
Программа
- Введение в анализ для обнаружения аномалий
- Методы обнаружения аномалий
- Z-оценка и сглаженная z-оценка для обнаружения аномалий
- Изолирующий лес для обнаружения аномалий
- Метод эллиптической огибающей для обнаружения аномалий
- Автоэнкодер для обнаружения аномалий
Цели
Основная цель этого семинара заключается в том, чтобы познакомить участников с методами машинного обучения, используемыми в области обнаружения аномалий. После семинара участники должны быть в состоянии применять методы на практике с реальными данными.
Целевая аудитория
Целевая аудитория включает новичков и поклонников обработки и анализа данных, стремящихся изучить основы обнаружения аномалий.
Предварительные условия курса
Технические требования:
- Среда Anaconda с Python 3.7
- Библиотеки Python: sklearn, keras
- TensorFlow