Big Data Moscow 2018

Валентина Джорджевич

Things Solver, Сербия

Дата: 10 октября, 2018
Время проведения: 10:00-17:00
Язык: Aнглийский

Биография

Валентина Джорджевич работает специалистом по обработке данных в компании Things Solver. Она получила степень бакалавра в области информационных систем и технологий и степень магистра в области бизнес-аналитики в Белградском университете на факультете организационных наук. Основными областями исследований, в которых она специализируется, являются анализ временных рядов и методы обнаружения аномалий. Она обладает глубокими техническими знаниями в области обработки и анализа данных, включая программирование (Java, Python, SQL, ETL), статистику (описательная статистика, тестирование гипотез, теория вероятностей и т. д.), моделирование (алгоритмы машинного обучения – нейронные сети, решающие деревья, линейная регрессия, метод k-средних, деревья изоляции, правила ассоциации, рекомендательные системы, модели ARIMA и т. д.) и визуализацию (Matplotlib, Plotly, Tableau и т. д.). Проблемы обработки и анализа данных, с которыми она работает, связаны с различными отраслями: от телекоммуникаций до розничной торговли и банковского дела, где она занимается прогнозированием, диагностическим техническим обслуживанием, обнаружением аномалий, сегментацией, предотвращением оттока клиентов и т. д.

Мастер-класс

Прогноз временных рядов

На этом мастер-классе будут рассмотрены основные концепции анализа временных рядов, такие как разложение временных рядов, анализ стационарности, сглаживание тренда и сезонности. Далее будут представлены и исследованы некоторые из самых популярных алгоритмов, используемых для прогнозирования временных рядов. Мастер-класс будет включать в себя программирование на Python и его библиотеку для прогнозирования временных рядов – pyflux.

Программа

  1. Введение в анализ временных рядов
    – Что такое временной ряд?
    – Разложение временных рядов
    – Тестирование стационарности
  2. Введение в библиотеку Pyflux
    – Основные концепции и общий обзор функциональности
    – Изучение моделей и их характеристик, допущений и параметров
  3. Примеры из практики
    • Разделение набора на наборы для обучения и тестирования
    • Определение модели
    • Наложение модели
    • Получение результатов модели и оценка эффективности модели
    • Сравнительный анализ различных моделей

Цели

Основная цель мастер-класса — познакомить участников с основными концепциями анализа временных рядов, а также методиками прогнозирования, доступными в библиотеке PyFlux.

Целевая аудитория

Целевая аудитория включает в себя тех лиц, которые заинтересованы в методиках прогнозирования временных рядов, примерах и областях применения. Приглашается каждый, кто любит программирование, а также прикладную математику, чтобы узнать для себя что-то новое.

Технические требования

– Установленное ПО:

            – Anaconda с Python 2.7, и установленной в нем лабораторией Pyflux.

– Технические знания:

            – Основы программирования на Python, или некоторых других языках программирования.

            – Основы математики.

Дата: 11 октября, 2018