Big Data Days 2019

 8-10 октября   Москва

Подтверждённые доклады

подтверждённые доклады на данный момент

Диего Уэлтес

RavenPack, Испания

Ключевой доклад

Анализ и обработка данных для ленивых, автоматизированное машинное обучение

Анализ и обработка данных — это весело, правда? Очистка данных, подбор объектов, предварительная обработка, построение функций, выбор модели, оптимизация параметров, проверка модели — эээ, подождите — вы уверены? Как насчет автоматизации 80 % работы, которая сможет сделать выбор даже лучше, чем вы? Автоматизированное машинное обучение стало вашим личным помощником…

Читать больше…

Дэвид Пилато

elastic, Франция

Ключевой доклад

Управление журналами черных пятниц

Контроль всего приложения является непростой задачей, но с правильными инструментами это не так уж и сложно. Тем не менее, такие события, как Черная Пятница, могут привести к работе вашего приложения на пределе, и даже к фатальному сбою. Когда система находится в нагруженном состоянии, она генерирует гораздо больше журналов, что также может привести к фатальному сбою системы контроля. В этой лекции я пройдусь по рекомендациям по использованию технологии Elastic Stack для централизации и контроля журналов.

Читать больше…

Доклад

Elasticsearch для приложений прежних версий

Как обеспечить сочетание вселенных SQL и NoSQL, не прибегая к радикальным изменениям?
Я покажу вам, как добавить Elasticsearch в приложения прежних версий и не изменять ваших привычек разработчика. Функции расширенного поиска появятся в вашем приложении мгновенно, без необходимости написания сложного SQL-кода!
Я начну с приложения на основе Spring Boot/Postgresql/MySQL и добавлю полную интеграцию с Elasticsearch.

Читать больше…

Search
Data
Elasticsearch
Opensource

Валерий Бабушкин

X5 Retail Group/ Yandex, Россия

Доклад

Как ускорить А/Б тестирование в 10-100 раз

А/Б тестирование весьма каверзная задача, особенно когда количество данных слишком мало, чтобы сделать выводы за адекватное количество времени. Хочу рассказать историю о том, как в одном сервисе переключились на новую, самую важную метрику, в связи с чем количества необходимого для А/Б трафика упало в 2 раза и отом, как мы решили эту проблему с помощью Линеаризации, перевзвешивания, машинного обучения и теоремы Баеса.

Читать больше…

A/B Testing
Bayes
Linearization
Machine Learning

Констант Брайдон

OCTO Technology, Франция

Доклад

На борту искусственного интеллекта: подготовка, развертывание и использование глубокого обучения на устройстве Edge, Raspberry Pi

Приложения для машинного обучения являются новыми в разработке программного обеспечения, и их, как правило, трудно создавать. Как отмечено Google в статье, это происходит в основном потому, что приложения гораздо шире самой модели. Однако, на удивление, приложение для машинного обучения следуют двойному закону Парето. С одной стороны, 80 % времени, потраченного на создание…

Читать больше…

Deep Learning
Raspberry

Гульемо Иозиа

MSD, Ирландия

#1 Доклад

Распределенное глубокое обучение с Keras и TensorFlow на Apache Spark

DeepLearning4J – это распределенная платформа с открытым исходным кодом для глубокого обучения на JVM. Это позволяет импортировать модели Python (Keras и TensorFlow) для их обучения распределенным образом на Apache Spark. Разговор будет идти о причинах создания распределенных моделей глубокого обучения на Python в среде JVM и о подробностях подготовки серийного выполнения этого процесса.

Читать больше…

Distributed Deep Learning
Apache Spark
TensorFlow
Keras
#2 Доклад

Глубокое обучение в управлении сбоев с Apache Spark

During this talk I will walk through a real-world example of AIOps: automated root cause analysis of Apache Spark cluster failures on Kubernetes environments doing Deep Learning with DL4J and… Apache Spark itself.

Читать больше…

Machine Learning

Юлия Столина

Outbrain, Израиль

Доклад

Источники данных реального времени с использованием Spark Streaming

В компании Outbrain мы обслуживаем миллиарды персонализированных рекомендаций. Наши модели обслуживания ML построены на пакетных потоках ELT. Однако, для нашего бизнеса чрезвычайно важно получать исходные данные в почти реальном времени. В ходе этой сессии я расскажу о том, как мы перешли от аналитики на основе пакетов к аналитике реального времени.

Читать больше…

Lambda Architecture
Spark Streaming
Kafka

Ненад Божич

SmartCat, Сербия

Доклад

Что нужно для создания готового к производству решения ИИ

Мы являемся компанией по обработке данных, которая сотрудничает с другими компаниями с целью помочь им создавать решения с искусственным интеллектом. Мы — смешанный коллектив ученых и инженеров в области обработки данных, поэтому мы с разных точек зрения рассматриваем вопрос о том, как интегрировать следующий большой модуль ИИ в платформу. Это основная причина того…

Читать больше…

AI Solution

Келли Шлам

IBM Canada Ltd., Канада

Доклад

Анализ и обработка данных и искусственный интеллект: Вопросы инфраструктуры

Искусственный интеллект все чаще рассматривается как конкурентное преимущество, и каждая компания старается быстро стать частью этой революции. Однако сам по себе ИИ сталкивается с резкой кривой окупаемости. Например, у вас верные данные? У вас есть нужные навыки? Может ли каждый участвовать (как правило, ИИ находится в руках немногих привилегированных, а компании изо всех сил…

Читать больше…

Data Science Infrastructure

Валентина Джорджевич

Things Solver, Сербия

Доклад

Прорыв в области алгоритма оценки потенциальных клиентов

Ведущим (лидом) считается любой человек, способный стать потенциальным клиентом, поскольку он заинтересован в продукте или услуге, предлагаемых компанией. Под лидогенерацией понимается метод сбора лидов для более эффективного управления каналами продаж, повышения узнаваемости бренда и способствования росту прибыли. Подсчет лидов включает в себя присвоение определенного…

Читать больше…

Lead Scoring
Data Science

Денис Емельянцев

McKinsey & Company, Россия

Доклад

Как обеспесчить работу дата-сайнс модели в масштабах всего бизнеса

Применением инструментов углубленной аналитики и data science моделей в бизнесе сейчас мало кого можно удивить. В крупных компаниях уже давно существую целые департаменты, которые отвечают за работы с большими данными. При этом немногим пока удалось внедрить data science модели в ежедневную работу всей компании и добиться реальных финансовых результатов для бизнеса.

Читать больше…

Data Science
Большие данные
Устойчивость
Финансовый эффект