Big Data Days 2019

 8-10 октября   Москва

Подтверждённые доклады

подтверждённые доклады на данный момент

Милош Милованович

Things Solver, Сербия

Доклад

Кому необходимо управление данными?

С быстрым развитием углубленной аналитики и с учетом сжатых сроков выполнения проектов, требуемых бизнес-подразделениям, управление данными часто остается в стороне. Эта среда ведет к формированию неконсолидированного и децентрализованного подхода к аналитическим проектам, где организации не хватает общего представления о цельных бизнес-процессах. Тем не менее некоторая польза от проектов…

Читать больше…

Data Management
Data Governance
Advanced Analytics
Доклад

Изначальное преимущество нативных облачных приложений

В нынешнюю эпоху микросервисов возникает необходимость эффективного построения приложений, управляемых событиями, однако традиционные системы обработки сообщений отстают, поскольку они не являются гибкими при адаптации к облаку. В этом докладе я представлю Siddhi, являющуюся системой потоковой обработки данных с открытым исходным кодом. Она способна обеспечить эффективный…

Читать больше…

Stream Processing
Kubernetes
Event Driven Applications

Богдан Ивченко

Dataworkz, Голландия

Доклад

От нейронных сетей до обмана местных властей

Мы расскажем вам историю о том, как мы планируем подорвать парковочный сектор в Голландии. Все началось, когда один из нас получил 5 штрафов за парковку в один день. В настоящее время процесс продажи билетов полностью автоматизирован с помощью так называемых сканирующих автомобилей. Эти автомобили сканируют номерные знаки автомобилей и проверяют, заплатил ли владелец…

Читать больше…

Real Time Object Detection

Андрей Голуб

ELSE Corp Srl, Италия

Доклад

Использование Малых Данных (Small Data), синтетических данных (Synthetic Data) в построении ИИ моделей для Модного Ритейла

Можно ли улучшить качество ИИ моделей, благодаря использованию «малых данных» (Small Data)? Корректно ли обучать и настраивать ИИ модели при помощи «синтетических данных» (Synthetic Data)? Возможно ли создать эффективную Нейронную Сеть для работы с Big Data, имея вначале лишь ограниченный набор данных, помноженный на глубокое понимание природы этих данных?

Читать больше…

Small Data
Recommendation Systems
Fashion

Мацей Брынски

Payability, Польша

Доклад

Большие данные на Kubernetes

В своей презентации я хочу показать, как можно использовать технологии больших данных на кластере Kubernetes. К ним относятся: Kafka, HDFS, Spark и Flink. Я расскажу о своем опыте и о тех проблемах, которые нужно решать. Я также покажу как использовать Kubernetes с существующей инфраструктурой Hadoop.

Читать больше…

Kubernetes
Hadoop
Kafka
Spark

Владимир Крылов

Artezio, Россия

Доклад

Семиотический анализ юридических текстов

В отличие от семантического анализа LSA, который извлекает имманентные темы из текста, семиотический анализ имеет целью интерпретировать нарративный текст в терминах заранее определенных умственных конструкций, называемых знаками. Такие задачи создают новую область NLU — Natural Language Understanding.

Читать больше…

Natural Language Understanding
Semiotic Analysis

Вадим Стрижов

Московский физико-технический институт, Россия

Доклад

Оценка оптимального объема выборки и выбор моделей машинного обучения

Обсуждаются методы выбора моделей машинного обучения для случая, когда у нас нет данных. Для построения моделей данные надо собрать. Эта работа требует значительных усилий и ресурсов. Особенно, если речь идет о медицине. Например, специальный анализ крови одного пациента стоит более трех тысяч евро. Принятые статистические методы оценки объема выборки требуют до пятисот пациентов.

Читать больше…

Машинное обучение
Oценка оптимального объема выборки
Bыбор моделей

Владимир Богдановский

Home Credit Bank, Россия

Доклад

Home Credit: наш путь к Data Driven

Каждый современный банк сталкивается с большими вызовами: стремительный рост количества транзакций в совокупности с желанием удовлетворить растущие потребности клиентов в качественном и быстром сервисе заставляет по-иному взглянуть на процессы работы с данными. Растет количество задач, в которых активно используются большие данные для достижения максимального бизнес-результата.

Читать больше…

Big Data
Cloudera
Data Lake

Андрей Леушев

Farzoom, Россия

Доклад

AI в банковской сфере

Ни для кого не секрет, что у банков есть реальные большие данные, а банковский данные являются ключом для понимания всех открытых данных. Чтобы понять открытые данные, необходимо изучить сами данные, и для этого используется ИИ. ИИ крайне результативен при распознавании документов. Этот принцип также можно увидеть и в статистике: кредитные рейтинги, основанные на ИИ, намного точнее, чем традиционные показатели.

Читать больше…

Big Data
Data Science
Machine Learning