Big Data Days 2019

 8-10 октября   Москва

Подтверждённые доклады

подтверждённые доклады на данный момент

Констант Брайдон

OCTO Technology, Франция

Доклад

На борту искусственного интеллекта: подготовка, развертывание и использование глубокого обучения на устройстве Edge, Raspberry Pi

Приложения для машинного обучения являются новыми в разработке программного обеспечения, и их, как правило, трудно создавать. Как отмечено Google в статье, это происходит в основном потому, что приложения гораздо шире самой модели. Однако, на удивление, приложение для машинного обучения следуют двойному закону Парето. С одной стороны, 80 % времени, потраченного на создание…

Читать больше…

Deep Learning
Deployment
On Board
Production

Гульемо Иозиа

MSD, Ирландия

Доклад

Распределенное глубокое обучение с Keras и TensorFlow на Apache Spark

DeepLearning4J – это распределенная платформа с открытым исходным кодом для глубокого обучения на JVM. Это позволяет импортировать модели Python (Keras и TensorFlow) для их обучения распределенным образом на Apache Spark. Разговор будет идти о причинах создания распределенных моделей глубокого обучения на Python в среде JVM и о подробностях подготовки серийного выполнения этого процесса.

Читать больше…

Distributed Deep Learning
Apache Spark
DL4J
Java

Юлия Столина

Outbrain, Израиль

Доклад

Источники данных реального времени с использованием Spark Streaming

В компании Outbrain мы обслуживаем миллиарды персонализированных рекомендаций. Наши модели обслуживания ML построены на пакетных потоках ELT. Однако, для нашего бизнеса чрезвычайно важно получать исходные данные в почти реальном времени. В ходе этой сессии я расскажу о том, как мы перешли от аналитики на основе пакетов к аналитике реального времени.

Читать больше…

Big Data
Spark Streaming
Kafka
Lambda Architecture

Диего Уэлтес

RavenPack, Испания

Доклад

Анализ и обработка данных для ленивых, автоматизированное машинное обучение

Анализ и обработка данных — это весело, правда? Очистка данных, подбор объектов, предварительная обработка, построение функций, выбор модели, оптимизация параметров, проверка модели — эээ, подождите — вы уверены? Как насчет автоматизации 80 % работы, которая сможет сделать выбор даже лучше, чем вы? Автоматизированное машинное обучение стало вашим личным помощником…

Читать больше…

Machine Learning
Automated Machine Learning

Ненад Божич

SmartCat, Сербия

Доклад

Что нужно для создания готового к производству решения ИИ

Мы являемся компанией по обработке данных, которая сотрудничает с другими компаниями с целью помочь им создавать решения с искусственным интеллектом. Мы — смешанный коллектив ученых и инженеров в области обработки данных, поэтому мы с разных точек зрения рассматриваем вопрос о том, как интегрировать следующий большой модуль ИИ в платформу. Это основная причина того…

Читать больше…

AI Solution
Production Ready
Human in the Loop
Success Criteria
Exploratory Analysis

Келли Шлам

IBM Canada Ltd., Канада

Доклад

Анализ и обработка данных и искусственный интеллект: Вопросы инфраструктуры

Искусственный интеллект все чаще рассматривается как конкурентное преимущество, и каждая компания старается быстро стать частью этой революции. Однако сам по себе ИИ сталкивается с резкой кривой окупаемости. Например, у вас верные данные? У вас есть нужные навыки? Может ли каждый участвовать (как правило, ИИ находится в руках немногих привилегированных, а компании изо всех сил…

Читать больше…

Infrastructure
Data Science Power

Валентина Джорджевич

Things Solver, Сербия

Доклад

Прорыв в области алгоритма оценки потенциальных клиентов

Ведущим (лидом) считается любой человек, способный стать потенциальным клиентом, поскольку он заинтересован в продукте или услуге, предлагаемых компанией. Под лидогенерацией понимается метод сбора лидов для более эффективного управления каналами продаж, повышения узнаваемости бренда и способствования росту прибыли. Подсчет лидов включает в себя присвоение определенного…

Читать больше…

Lead Generation
Lead Scoring
Data Science
Optimization

Ольга Петрова

Sencha, Германия

Доклад

Visual ML с TensorFlow.js

Преимущества выполнения машинного обучения (ML) в браузере используя TensorFlow.js не ограничиваются конфиденциальностью пользовательских данных. Важным моментом является наличие богатого набора инструментов для интерактивной визуализации и пользовательских интерфейсов, доступных для JavaScript. Это позволяет нам заглянуть внутрь процесса подготовки модели…

Читать больше…

Visualization
Tensorflow.js
Machine Learning

Соня Либерман

Outbrain, Израиль

Доклад

От Spark до Elasticsearch и обратно - обучение масштабным моделям для рекомендации контента

Обслуживание десятков миллиардов персональных рекомендаций с задержкой 30 мс — сложная задача. В этом выступлении я поделюсь нашей алгоритмической архитектурой, включая автономный слой на основе Spark и его обслуживающий слой на основе Elasticsearch, которые позволяют проводить сложные модели в сложных ограничениях масштаба и сократить цикл между научными исследованиями и продукцией.

Читать больше…

Machine Learning
Spark
Elasticsearch
Recommender System

Миль Хостенс

Utrecht University, Голландия

Доклад

Прогнозирование момента отёла у дойных коров с использованием анализа временных рядов в Apache Spark

Количество мертворожденных, то есть количество телят, умерших во время не наблюдаемых родов, часто рассматривается в качестве показателя снижения благополучия дойных коров. Молочным фермерам предлагаются датчики, но модели точного прогнозирования отела зачастую отсутствуют. В этой сессии будет описан канал данных для машинного обучения с использованием фреймворка Spark ML.

Читать больше…