Big Data Days 2021

Hybrid Edition

28-30 Cентября

Москва и онлайн

Программа

Мастер-классы

(24 ноября)

1) При покупке билета вы получаете доступ только на один выбранный вами мастер-класс. Все мастерклассы проходят параллельно, поэтому приобретенный билет дает вам право на посещение только одного, выбранного вами мастер-класса.
2) Поменять мастер-класс во время их проведения (24 ноября) возможности не будет.
3) Язык проведения указан у каждого конкретного мастер-класса. Язык проведения каждого мастеркласса зависит от того, англо- или русскоговорящим является тренер.
4) Синхронный перевод мастер-классов НЕ ПРЕДУСМОТРЕН, поэтому перед выбором темы оцените возможности своего английского языка. Однако, все тренеры знают о наличии языкового барьера, поэтому приложат максимальные усилия, чтобы облегчить участникам мастер классов понимание обсуждаемой темы.
5) Внимательно ознакомьтесь с требованиями к участникам каждого мастер-класса.

Время: 11:00 – 18:30 (GMT+3)

10:00 – 11:00 Регистрация
11:00 Начало мастер-класса
12:30 – 12:40 Перерыв
14:00 – 15:00 Обеденный перерыв
16:20 – 16:30 Перерыв
18:00 Окончание мастер-класса

Stream Processing Essentials

Nicolas Fränkel & Vladimir Schreiner
Hazelcast

Читать больше »

Building a Data Catalog

Mandy Chessell
ODPi TSC & ODPi Egeria & IBM

Читать больше »

1-ый день конференции

(25 ноября)

! Синхронный перевод с английского языка не предусмотрен
(ENG) – доклады на английском языке
(RU) – доклады на русском языке

Время Трек 1 (ENG) Трек 2 (ENG) Трек 3 (ENG) Трек 4 (ENG) Трек 5 (RU) Трек 6 (RU)
09:00 - 10:00 (GMT+3) Регистрация
10:00 - 11:00 (GMT+3)
Вступительная речь:
Growth Reinvented - Turn Your Data and AI into Money
Мика Руоконен
Futurice
Slides
11:05 - 11:50 (GMT+3) Streaming Processing - an Overview of the Concepts, Architecture and Technology of Doing Data Science on Real-Time Data
Бас Гердинк
Aizonic
Трек 1 (ENG)
Analyzing Public Data About User Queries on Search Engine to Predict Trends and Evaluate Markets
Паоло Делло Викарио
ByTek
Slides
Трек 2 (ENG)
Redis: a Multi-Model DB for IoT and Beyond
Др. Кристоф Цимерман
Redis Labs
Slides
Трек 3 (ENG)
Covid-19: Big Data Analytics and Artificial Intelligence
Кристиан Рандьери
Intellisystem Technologies
Трек 4 (ENG)
ML & ART
Зобнина Татьяна
Naumen
Slides
Трек 5 (RU)
Выделение режимов и поиск аномалий в задаче предиктивной аналитики c помощью методов Deep Learining
Просветов Артем
ЛАНИТ
Трек 6 (RU)
11:50 - 12:05 (GMT+3) Перерыв
12:05 - 12:50 (GMT+3) Processing Billions of Events a Day Using Kafka and Kafka Streams
Карлос Мануель Дуклос-Вергара
Schibsted
Трек 1 (ENG)
Designing and Building Data Science Solutions
Джонатан Лесли
Нери Ван Оттен
Pivigo; Spot Intelligence
Slides
Трек 2 (ENG)
TBA
Data Governance From an Engineering Perspective
Валдас Максимавичюс
Cognizant
Трек 4 (ENG)
Создание современной аналитической платформы розничного банковского бизнеса на базе экосистемы Cloudera
Вилков Евгений & Колесникова Елена
Glowbyte Consulting & Газпромбанк
Slides
Трек 5 (RU)
Язык Rust для высоконагруженного сетевого сервиса - быстрый старт и стремительный полет
Сербул Александр
1C-Bitrix
Slides
Трек 6 (RU)
12:55 - 13:40 (GMT+3) Real-Time Stream Processing for Insurance & Health Care With Kafka, Kafka Streams and Multi-Runtime Microservices
Кристиан Преведелло
PREVINET
Slides
Трек 1 (ENG)
Exoplanet Detection using Machine Learning
Абишек Малик
Hawk:AI
Трек 2 (ENG)
Data Versioning - What Does it Mean?
Эйнат Орр
Treeverse
Трек 3 (ENG)
The GDPR Challenges to Big Data, and How to Overcome Them
Silvan Jongerius
TechGDPR
Трек 4 (ENG)
Опыт монетизации данных через стартап
Зыков Роман
Retail Rocket
Slides
Трек 5 (RU)
Искусственный интеллект и решения оптимизационных задач в физических науках
Устюжанин Андрей
НИУ ВШЭ
Slides
Трек 6 (RU)
13:40 - 14:40 (GMT+3) Виртуальное кафе: Работа в офисе или удаленные команды, что перспективнее
Игорь Сухоруков
Виртуальные кафе
Slides
Виртуальное кафе: Внутренняя монетизация данных в компании
Роман Зыков
Виртуальные кафе
Обеденный перерыв
14:40 - 15:25 (GMT+3) Real-Time Streaming with Python ML Inference
Marko Topolnik
Hazelcast
Slides
Трек 1 (ENG)
Advanced Analytics in the Industry
Antía Fernández
GRADIANT
Трек 2 (ENG)
An Experiment in Continuous Deployment of JVM applications
Николас Френкель
Hazelcast
Трек 4 (EN)
Adding AI Cloud Services to Your On-Prem Data Workflows for NLP & Content Enrichment
Дэниел Ригли
SHI GmbH
Slides
Трек 4 (ENG)
Канбан для управления AI проектами
Уразбаев Асхат
ScrumTrek
Трек 5 (RU)
Выбор модели и анализ ошибки
Стрижов Вадим
Московский физико-технический институт
Трек 6 (RU)
15:30 - 16:15 (GMT+3) Introduction to FLaNK Stack
Тимоти Дж. Спанн
Cloudera
Slides
Трек 1 (ENG)
5 Pillars of User-Centric Analytics
Алекс Сангинов
ServiceNow
Трек 2 (ENG)
Azure Synapse Analytics Overview
Джеймс Серра
Microsoft
Slides
Трек 3 (ENG)
Big Data Architecture in the Advertising Industry
Марсал Сератте
Hybrid Theory
Трек 4 (ENG)
Оценка и доказательство экономического эффекта от применения алгоритмов машинного обучения
Арустамов Алексей
Loginom Company
Трек 5 (RU)
Озеро данных в S3 хранилище на основе Dremio OSS и Redshift Spectrum
Сухоруков Игорь
Align Technology
Трек 6 (RU)
16:15 - 16:30 (GMT+3) Перерыв
16:30 - 17:15 (GMT+3)
ЗАКЛЮЧИТЕЛЬНАЯ РЕЧЬ:
Making Data Downtime a Pillar of Your Data Strategy
Барр Мосес
Monte Carlo

2-ой день конференции

(26 ноября)

! Синхронный перевод с английского языка не предусмотрен
(ENG) – доклады на английском языке
(RU) – доклады на русском языке

Время Трек 1 (ENG) Трек 2 (ENG) Трек 3 (ENG) Трек 4 (ENG) Трек 5 (RU) Трек 6 (RU)
09:00 - 10:00 (GMT+3) Регистрация
10:00 - 11:00 (GMT+3)
Вступительная речь:
Introduction to Data Streaming
Николас Френкель
Hazelcast
11:05 - 11:50 (GMT+3) Kafka as a Platform: the Ecosystem from the Ground Up
Робин Моффат
Confluent
Трек 1 (ENG)
From Internet Access Devices Usage to Behavioural Model
Томаш Бак
Digital Fingerprints
Slides
Трек 2 (ENG)
Supercharge your Data Analytics with BigQuery ML
Мартон Кодок
REEA
Трек 3 (ENG)
Stopping Public Transport Coronavirus Infections with Big Data
Тим Фрай
iunera GmbH & Co. KG
Slides
Трек 4 (ENG)
Применение машинного обучения для распознавания сетевого трафика
Чернышов Юрий
“УЦСБ”
Трек 5 (RU)
Гибридные среды - будущее хранилищ данных
Золотарев Сергей
Arenadata
Трек 6 (RU)
11:50 - 12:05 (GMT+3) Перерыв
12:05 - 12:50 (GMT+3) Towards Enterprise-Grade Data Discovery at ING with Apache Atlas and Amundsen
Вердан Махмуд
ING Bank
Schibsted
Трек 1 (ENG)
Data Science Case Studies and Formulation of AI Roadmap
Кейн Ву
ThinkCol
Track 2 (ENG)
Interactive BI Analytics with Presto
Лукаш Осипюк
Кароль Собчак
Starburstdata
Slides
Трек 3 (ENG)
The application of Machine Learning to the Modelling of Time-Series of Atmospheric Pollution Data
Кристиан Рандьери
Intellisystem Technologies
Трек 4 (ENG)
Data-driven компания: как продемонстрировать ценность данных вашим коллегам
Ключников Евгений
GetYourGuide
Трек 5 (RU)
Работа с большими числовыми массивами в python
Головин Дмитрий
QuantNet
Трек 6 (RU)
12:55 - 13:40 (GMT+3) Kotlin for Apache Spark: Love to Frankenstein's Monster
Паша Финкельштейн
JetBrains
Трек 1 (ENG)
From the Earth to the Moon: Lessons from the Space Race to Apply in Machine Learning Projects
Диего Уэлтес
RavenPack
Slides
Трек 2 (ENG)
Scalable ML Pipelines for Enterprise Data Mastering
Сонал Гоял
Nube Technologies
Slides
Трек 3 (ENG)
From Zero to Hero with Kafka Connect
Робин Моффат
Confluent
Трек 4 (ENG)
Как построить Data Platform на Open source, делая всё не так
Шостко Дмитрий
Леруа Мерлен
Трек 5 (RU)
Влияние неопределённости в обучающей выборке на качество распознавания изображений
Терешонок Максим
РТУ МИРЭА
Трек 6 (RU)
13:40 - 14:40 (GMT+3) Виртуальное кафе: Data Mess Science: как дата-сайентисты обманывают себя и окружающих
Дмитрий Каштанов
Виртуальные кафе
Обеденный перерыв
14:40 - 15:25 (GMT+3) Orchestrating Data Workflows Using a Fully Serverless Architecture
Томер Леви
Fundbox
Трек 1 (ENG)
In the Shallow with AI
Одри Лобо-Пуло
Phoensight
Трек 2 (ENG)
Graph Processing for Open Metadata and Governance
Mandy Chessell
ODPi TSC & ODPi Egeria & IBM
Slides
Трек 3 (ENG)
Trust and Quality in the Era of Software 2.0
Яннис Канеллопулос
Code4Thought
Slides
Трек 4 (ENG)
Топологический анализ временных рядов для прогнозирования покупательской активности
Бурнаев Евгений
Сколтех
Трек 5 (RU)
Serverless multi-cloud Python-based ML pipelines without Hadoop.
Каштанов Дмитрий
Piano.io
Трек 6 (RU)
15:30 - 16:15 (GMT+3) Best Practices for Building Streaming Data Architectures
Рикардо Феррейра
Elastic
Slides
Track 1 (ENG)
A Recipe for Innovation: Recommending Recipes Based on Adventurousness
Ким Нильссон и Роберт Григ-Гран
Pivigo
Трек 2 (ENG)
The Intuition Behind the Use of M.L. in Marketing Analytics
Mario A Vinasco
Credit Sesame
Трек 3 (ENG)
Fixing the Problems with Face Recognition Using Modern Cryptography Flows
Незаре Чафни
Trueface
Track 4 (ENG)
AI + Digital Twin : новая парадигма управления индустриальными процессами?
Чеботарев Роман
Optimate AI
Трек 5 (RU)
Cloudera Data Platform в частном облаке: распределённые вычисления на K8s
Кирилл Голожин
Cloudera
Трек 6 (RU)
16:15 - 16:30 (GMT+3) Перерыв
16:30 - 17:15 (GMT+3)
ЗАКЛЮЧИТЕЛЬНАЯ РЕЧЬ:
The New ODPi - Moving from Standards to a Vendor-Neutral Home for Big Data Open Source
Джон Мертик
Linux Foundation
Slides

« Hазад