Big Data Days 2019
8-10 октября
Москва
Подтверждённые доклады
подтверждённые доклады на данный момент
Милош Милованович
Things Solver, Сербия
Кому необходимо управление данными?
С быстрым развитием углубленной аналитики и с учетом сжатых сроков выполнения проектов, требуемых бизнес-подразделениям, управление данными часто остается в стороне. Эта среда ведет к формированию неконсолидированного и децентрализованного подхода к аналитическим проектам, где организации не хватает общего представления о цельных бизнес-процессах. Тем не менее некоторая польза от проектов…



Шрискандарайджа Сихотаян
WSO2, Шри-Ланка
Изначальное преимущество нативных облачных приложений
В нынешнюю эпоху микросервисов возникает необходимость эффективного построения приложений, управляемых событиями, однако традиционные системы обработки сообщений отстают, поскольку они не являются гибкими при адаптации к облаку. В этом докладе я представлю Siddhi, являющуюся системой потоковой обработки данных с открытым исходным кодом. Она способна обеспечить эффективный…



Богдан Ивченко
Dataworkz, Голландия
От нейронных сетей до обмана местных властей
Мы расскажем вам историю о том, как мы планируем подорвать парковочный сектор в Голландии. Все началось, когда один из нас получил 5 штрафов за парковку в один день. В настоящее время процесс продажи билетов полностью автоматизирован с помощью так называемых сканирующих автомобилей. Эти автомобили сканируют номерные знаки автомобилей и проверяют, заплатил ли владелец…

Андрей Голуб
ELSE Corp Srl, Италия
Использование Малых Данных (Small Data), синтетических данных (Synthetic Data) в построении ИИ моделей для Модного Ритейла
Можно ли улучшить качество ИИ моделей, благодаря использованию «малых данных» (Small Data)? Корректно ли обучать и настраивать ИИ модели при помощи «синтетических данных» (Synthetic Data)? Возможно ли создать эффективную Нейронную Сеть для работы с Big Data, имея вначале лишь ограниченный набор данных, помноженный на глубокое понимание природы этих данных?



Мацей Брынски
Payability, Польша
Большие данные на Kubernetes
В своей презентации я хочу показать, как можно использовать технологии больших данных на кластере Kubernetes. К ним относятся: Kafka, HDFS, Spark и Flink. Я расскажу о своем опыте и о тех проблемах, которые нужно решать. Я также покажу как использовать Kubernetes с существующей инфраструктурой Hadoop.




Владимир Крылов
Artezio, Россия
Семиотический анализ юридических текстов
В отличие от семантического анализа LSA, который извлекает имманентные темы из текста, семиотический анализ имеет целью интерпретировать нарративный текст в терминах заранее определенных умственных конструкций, называемых знаками. Такие задачи создают новую область NLU — Natural Language Understanding.


Вадим Стрижов
Московский физико-технический институт, Россия
Оценка оптимального объема выборки и выбор моделей машинного обучения
Обсуждаются методы выбора моделей машинного обучения для случая, когда у нас нет данных. Для построения моделей данные надо собрать. Эта работа требует значительных усилий и ресурсов. Особенно, если речь идет о медицине. Например, специальный анализ крови одного пациента стоит более трех тысяч евро. Принятые статистические методы оценки объема выборки требуют до пятисот пациентов.



Владимир Богдановский
Home Credit Bank, Россия
Home Credit: наш путь к Data Driven
Каждый современный банк сталкивается с большими вызовами: стремительный рост количества транзакций в совокупности с желанием удовлетворить растущие потребности клиентов в качественном и быстром сервисе заставляет по-иному взглянуть на процессы работы с данными. Растет количество задач, в которых активно используются большие данные для достижения максимального бизнес-результата.



Андрей Леушев
Farzoom, Россия
AI в банковской сфере
Ни для кого не секрет, что у банков есть реальные большие данные, а банковский данные являются ключом для понимания всех открытых данных. Чтобы понять открытые данные, необходимо изучить сами данные, и для этого используется ИИ. ИИ крайне результативен при распознавании документов. Этот принцип также можно увидеть и в статистике: кредитные рейтинги, основанные на ИИ, намного точнее, чем традиционные показатели.


