Big Data Days 2019
8-10 октября
Москва
Подтверждённые доклады
подтверждённые доклады на данный момент
Диего Уэлтес
RavenPack, Испания
Анализ и обработка данных для ленивых, автоматизированное машинное обучение
Анализ и обработка данных — это весело, правда? Очистка данных, подбор объектов, предварительная обработка, построение функций, выбор модели, оптимизация параметров, проверка модели — эээ, подождите — вы уверены? Как насчет автоматизации 80 % работы, которая сможет сделать выбор даже лучше, чем вы? Автоматизированное машинное обучение стало вашим личным помощником…
Дэвид Пилато
elastic, Франция
Управление журналами черных пятниц
Контроль всего приложения является непростой задачей, но с правильными инструментами это не так уж и сложно. Тем не менее, такие события, как Черная Пятница, могут привести к работе вашего приложения на пределе, и даже к фатальному сбою. Когда система находится в нагруженном состоянии, она генерирует гораздо больше журналов, что также может привести к фатальному сбою системы контроля. В этой лекции я пройдусь по рекомендациям по использованию технологии Elastic Stack для централизации и контроля журналов.
Elasticsearch для приложений прежних версий
Как обеспечить сочетание вселенных SQL и NoSQL, не прибегая к радикальным изменениям?
Я покажу вам, как добавить Elasticsearch в приложения прежних версий и не изменять ваших привычек разработчика. Функции расширенного поиска появятся в вашем приложении мгновенно, без необходимости написания сложного SQL-кода!
Я начну с приложения на основе Spring Boot/Postgresql/MySQL и добавлю полную интеграцию с Elasticsearch.




Валерий Бабушкин
X5 Retail Group/ Yandex, Россия
Как ускорить А/Б тестирование в 10-100 раз
А/Б тестирование весьма каверзная задача, особенно когда количество данных слишком мало, чтобы сделать выводы за адекватное количество времени. Хочу рассказать историю о том, как в одном сервисе переключились на новую, самую важную метрику, в связи с чем количества необходимого для А/Б трафика упало в 2 раза и отом, как мы решили эту проблему с помощью Линеаризации, перевзвешивания, машинного обучения и теоремы Баеса.




Констант Брайдон
OCTO Technology, Франция
На борту искусственного интеллекта: подготовка, развертывание и использование глубокого обучения на устройстве Edge, Raspberry Pi
Приложения для машинного обучения являются новыми в разработке программного обеспечения, и их, как правило, трудно создавать. Как отмечено Google в статье, это происходит в основном потому, что приложения гораздо шире самой модели. Однако, на удивление, приложение для машинного обучения следуют двойному закону Парето. С одной стороны, 80 % времени, потраченного на создание…


Гульемо Иозиа
MSD, Ирландия
Распределенное глубокое обучение с Keras и TensorFlow на Apache Spark
DeepLearning4J – это распределенная платформа с открытым исходным кодом для глубокого обучения на JVM. Это позволяет импортировать модели Python (Keras и TensorFlow) для их обучения распределенным образом на Apache Spark. Разговор будет идти о причинах создания распределенных моделей глубокого обучения на Python в среде JVM и о подробностях подготовки серийного выполнения этого процесса.




Глубокое обучение в управлении сбоев с Apache Spark
During this talk I will walk through a real-world example of AIOps: automated root cause analysis of Apache Spark cluster failures on Kubernetes environments doing Deep Learning with DL4J and… Apache Spark itself.

Юлия Столина
Outbrain, Израиль
Источники данных реального времени с использованием Spark Streaming
В компании Outbrain мы обслуживаем миллиарды персонализированных рекомендаций. Наши модели обслуживания ML построены на пакетных потоках ELT. Однако, для нашего бизнеса чрезвычайно важно получать исходные данные в почти реальном времени. В ходе этой сессии я расскажу о том, как мы перешли от аналитики на основе пакетов к аналитике реального времени.



Ненад Божич
SmartCat, Сербия
Что нужно для создания готового к производству решения ИИ
Мы являемся компанией по обработке данных, которая сотрудничает с другими компаниями с целью помочь им создавать решения с искусственным интеллектом. Мы — смешанный коллектив ученых и инженеров в области обработки данных, поэтому мы с разных точек зрения рассматриваем вопрос о том, как интегрировать следующий большой модуль ИИ в платформу. Это основная причина того…

Келли Шлам
IBM Canada Ltd., Канада
Анализ и обработка данных и искусственный интеллект: Вопросы инфраструктуры
Искусственный интеллект все чаще рассматривается как конкурентное преимущество, и каждая компания старается быстро стать частью этой революции. Однако сам по себе ИИ сталкивается с резкой кривой окупаемости. Например, у вас верные данные? У вас есть нужные навыки? Может ли каждый участвовать (как правило, ИИ находится в руках немногих привилегированных, а компании изо всех сил…

Валентина Джорджевич
Things Solver, Сербия
Прорыв в области алгоритма оценки потенциальных клиентов
Ведущим (лидом) считается любой человек, способный стать потенциальным клиентом, поскольку он заинтересован в продукте или услуге, предлагаемых компанией. Под лидогенерацией понимается метод сбора лидов для более эффективного управления каналами продаж, повышения узнаваемости бренда и способствования росту прибыли. Подсчет лидов включает в себя присвоение определенного…


Денис Емельянцев
McKinsey & Company, Россия
Как обеспесчить работу дата-сайнс модели в масштабах всего бизнеса
Применением инструментов углубленной аналитики и data science моделей в бизнесе сейчас мало кого можно удивить. В крупных компаниях уже давно существую целые департаменты, которые отвечают за работы с большими данными. При этом немногим пока удалось внедрить data science модели в ежедневную работу всей компании и добиться реальных финансовых результатов для бизнеса.



