Big Data Moscow 2018

Валентина Джорджевич

Things Solver, Сербия

Биография

Валентина Джорджевич работает специалистом по обработке данных в компании Things Solver. Она получила степень бакалавра в области информационных систем и технологий и степень магистра в области бизнес-аналитики в Белградском университете на факультете организационных наук. Основными областями исследований, в которых она специализируется, являются анализ временных рядов и методы обнаружения аномалий. Она обладает глубокими техническими знаниями в области обработки и анализа данных, включая программирование (Java, Python, SQL, ETL), статистику (описательная статистика, тестирование гипотез, теория вероятностей и т. д.), моделирование (алгоритмы машинного обучения – нейронные сети, решающие деревья, линейная регрессия, метод k-средних, деревья изоляции, правила ассоциации, рекомендательные системы, модели ARIMA и т. д.) и визуализацию (Matplotlib, Plotly, Tableau и т. д.). Проблемы обработки и анализа данных, с которыми она работает, связаны с различными отраслями: от телекоммуникаций до розничной торговли и банковского дела, где она занимается прогнозированием, диагностическим техническим обслуживанием, обнаружением аномалий, сегментацией, предотвращением оттока клиентов и т. д.

Доклад

Обнаружение аномалий в области телекоммуникаций

В этой презентации будут рассмотрены типы аномалий, которые часто встречаются в данных, и сравнительный анализ двух разных методов, которые могут быть использованы для их обнаружения – автоэнкодеры и деревья изоляции. После краткого введения в теоретические концепции этих методов, а также их преимущества и недостатки, будут представлены и проанализированы результаты их применения к данным из телекоммуникационной сети.

Мастер-класс

Прогноз временных рядов

На этом семинаре будут рассмотрены основные концепции анализа временных рядов, такие как разложение временных рядов, анализ стационарности, сглаживание тренда и сезонности. Далее будут представлены и исследованы некоторые из самых популярных алгоритмов, используемых для прогнозирования временных рядов. Семинар будет включать в себя программирование на Python и его библиотеку для прогнозирования временных рядов – pyflux.

Дата: 11 октября, 2018