Big Data Days 2019

 8-10 октября   Москва

Валентина Джорджевич

Things Solver, Сербия

Биография

Валентина — страстный энтузиаст анализа и обработки данных. Она работает аналитиком данных в компании Things Solver с октября 2016. У нее имеется степень бакалавра в области информационных систем и технологий, и степень магистра в области интеллектуальной обработки данных в университете Белграда на факультете организационных наук. Основные направления исследований, на которых она сосредотачивается — анализ временных рядов и методы обнаружения аномалий. Она обладает значительными техническими знаниями в сфере анализа и обработки данных, включая программирование (Java, Python, SQL, ETL), статистику (описательная статистика, проверка гипотез, теория вероятностей), моделирование (алгоритмы машинного обучения — на основе ансамблей, нейронные сети, на основе сходства) и визуализацию (Matplotlib, Seaborn, Plotly, Tableau). Она работает над различными проблемами в области анализа и обработки данных в различных областях бизнеса, от телекоммуникаций до розничной торговли, финансов и банковского дела, где она решает задачи, связанные с прогнозированием, профилактическим обслуживанием, обнаружением аномалий, сегментацией, прогнозированием оттока клиентов, определением круга потенциальных потребителей, балльной оценкой и т. д.

Доклад

Прорыв в области алгоритма оценки потенциальных клиентов

Ведущим (лидом) считается любой человек, способный стать потенциальным клиентом, поскольку он заинтересован в продукте или услуге, предлагаемых компанией. Под лидогенерацией понимается метод сбора лидов для более эффективного управления каналами продаж, повышения узнаваемости бренда и способствования росту прибыли. Подсчет лидов включает в себя присвоение определенного веса каждому возможному действию лидов, ранжируя их поведение в зависимости от вероятности того, что они могут быть стать клиентами. В этом разделе будет показано, как научные данные можно использовать в целях оптимизации процесса анализа лидов. Я продемонстрирую реальный пример, где расширенный анализ показал, что даже идеального алгоритма подсчета лидов недостаточно для увеличения количества лидов, ставших клиентами. Основная идея заключается в том, чтобы представить преимущества использования анализа и обработки данных для извлечения выводов, обнаружения закономерностей поведения и выявления узких мест в процессе лидогенерации в целях оптимизации и повышения степени конверсии.

Ключевые слова

Lead Scoring
Data Science

Мастер-класс

Методы машинного обучения для обнаружения аномалий

Этот мастер-класс посвящён методам машинного обучения, которые можно использовать для обнаружения аномалий. Сессия будет проходить в три этапа, каждый из которых является более углубленным, чем предыдущий.

Этап 1 включает в себя теоретическое введение в обнаружение аномалий и охватывает основные методы обнаружения аномалий, такие как z-оценка и сглаженная z-оценка для обнаружения аномалий.

Этап 2 включает в себя более продвинутые алгоритмы машинного обучения, способные работать с многомерными наборами данных, такие как изолирующий лес и метод эллиптической огибающей.

Этап 3 включает в себя использование нейросети – автоэнкодера для обнаружения аномалий в больших многомерных наборах данных.