Big Data Days 2021

Online Edition

28-30 Cентября

онлайн

Мастер-классы

(30 Cентября)
Oнлайн
Oнлайн
08:40 - 09:00
Регистрация участников
Developing Performant Data Streaming Applications Using Kafka
Carlos Manuel Duclos-Vergara



Spark and HADOOP
Lidor Gerstel



ONNX runtime to serve AI models
Mauro Bennici



Improving Performance and Security in MySQL
Lukas Vileikis



An introduction to FluxLang
Riccardo Tommasini



Построение собственной поисковой системы с помощью Python
Артур Сапрыкин


09:00 - 10:30
Мастер-класс, часть I
10:30 - 10:40
Перерыв
10:40 - 12:00
Мастер-класс, часть II
12:00 - 13:00
Обед
13:00 - 14:20
Мастер-класс, часть III
14:20 - 14:30
Перерыв
14:30 - 16:30
Мастер-класс, часть IV
Oнлайн

Developing Performant Data Streaming Applications Using Kafka
Carlos Manuel Duclos-Vergara



Spark and HADOOP
Lidor Gerstel




ONNX runtime to serve AI models
Mauro Bennici



Improving Performance and Security in MySQL
Lukas Vileikis



An introduction to FluxLang
Riccardo Tommasini



Построение собственной поисковой системы с помощью Python
Артур Сапрыкин


Oнлайн
08:40 - 09:00
Регистрация участников
09:00 - 10:30
Мастер-класс, часть I
10:30 - 10:40
Перерыв
10:40 - 12:00
Мастер-класс, часть II
12:00 - 13:00
Обед
13:00 - 14:20
Мастер-класс, часть III
14:20 - 14:30
Перерыв
14:30 - 16:30
Мастер-класс, часть IV

1-ый день конференции

(28 Cентября)

! Синхронный перевод с английского языка не предусмотрен
(ENG) — доклады на английском языке
(RU) — доклады на русском языке

Время Трек 1: RU: Применение Трек 2: RU: Проекты Трек 3: ENG: Data Трек 4: ENG: Machine Learning Трек 5: ENG: Cloud and Streaming Трек 6: ENG: Varia
08:30 - 09:00 (MCK) Регистрация
09:00 - 10:00 (MCK)
Вступительная речь:
Trust Your Data
Mark Grover
Stemma
Data Discovery
Metadata
Amundsen
(Трек 3)
10:05 - 10:50 (MCK) Вероятностная Калибровка на Примере Probability Calibration Trees
Валерий Бабушкин
Facebook UK Ltd
ML
Probability Calibration Trees
Model Calibrations
Uncertainty Estimation
Трек 1: RU: Применение
Гиперавтоматизация Глазами Программного Робота
Сергей Вотяков
Академия Россия RPA2
RPA
Hyperautomation
Трек 2: RU: Проекты
Rethinking Ingestion: CI/CD for Data Lakes
Einat Orr
Treeverse
Data Lake
Data Versioning
Ingestion
Трек 3: ENG: Data
ML in Production – Serverless and Painless
Oliver Gindele
Datatonic
MLOps
Serverless
Containers
Tensorflow
Трек 4: ENG: Machine Learning
Designing Robust Processing System With Redis
Paško Pajdek
Mediatoolkit
Realtime Data Processing
Queueing
Redis
Трек 5: ENG: Cloud and Streaming
Building a Serverless GraphQL API in 25 Minutes
Maxime Beugnet
MongoDB
Serverless
API
MongoDB
Realm
Трек 6: ENG: Varia
10:50 - 11:05 (MCK) Утренний перерыв
11:05 - 11:50 (MCK) Воспитание моделей
Вадим Стрижов
МФТИ
ML
Model Selection
Трек 1: RU: Применение
Unboxing Многокомпонентных Big Data-проектов Инструментом DataLog на Основе Подхода Software Аs Аrtefact
Павел Симанихин
Neoflex
Big Data
Software As Artefact
DataLog
Трек 2: RU: Проекты
Data Observability
Gerard Toonstra
Datafold
Data Observability
Data Lineage
Catalog
Трек 3: ENG: Data
Machine Learning Helping the Economy
Diana Gabrielyan
Stockmann
ML
Text Mining
Economics
Inflation
Трек 4: ENG: Machine Learning
The Honest Review of Amazon SageMaker
Wojciech Gawroński
Pattern Match
ML
Cloud
Amazon
SageMaker
Трек 5: ENG: Cloud and Streaming
DataSecOps: Why You Should Care
Ben Herzberg
Satori
Cloud
DataOps
Security
Data Engineering
Трек 6: ENG: Varia
11:55 - 12:40 (MCK) Прогнозирование Качества Процесса Переработки Нефти При Помощи Машинного Обучения
Андрей Шагалов & Ольга Миндлина
Artezio
Predictive Models
Time Series
Oil Industry
Трек 1: RU: Применение
Обнаружение Плагиата в Новостях
Алексей Бурнаков
ТАСС
NLP
Hadoop
Plagiarism
Трек 2: RU: Проекты
Cloud Computing Anomaly and Threat Detection Using Big Data Analytics and Machine Learning
Ibrahim Muzaferija
Maestral Solutions
Cloud
ML
Anomaly Detection
Support Vector Machines
User Behavior Modeling
Трек 3: ENG: Data
A Friendly Introduction to Codeless Deep Learning
Kathrin Melcher
Knime
Deep Learning
CNN
Keras
KNIME
Трек 4: ENG: Machine Learning
The Importance of Performance in Open Source Databases
Lukas Vileikis
Severalnines
Databases
MySQL
Performance
Security
Трек 5: ENG: Cloud and Streaming
Expanding the Data Team: Analytics Engineers
Victoria Perez Mola
Tier mobility
Team Management
Data Team
Analytics Engineer
Трек 6: ENG: Varia
12:40 - 13:40 (MCK) Обеденный перерыв
13:40 - 14:25 (MCK) Оптимизация Нейросетевой Архитектуры Агента, Выполняющего Обучение с Подкреплением
Евгений Бурнаев
Skoltech
Reinforcement Learning
Neural Architecture Search
Atari Benchmark
Трек 1: RU: Применение
Качество Или Количество Данных – Что Важнее?
Юлия Рубцова
Data Monsters
Exploratory Data Analysis
Data Quality
Data Labeling
Трек 2: RU: Проекты
Graph Data Science: from Theory to Application
Julien Genovese
Data Reply
Graph Data Science
MLlib
Трек 3: ENG: Data
In-Database Machine Learning with Jupyter
Paige Roberts
Vertica
ML
Data Architecture
Jupyter
Трек 4: ENG: Machine Learning
Best practices for ETL with Apache NiFi on Kubernetes
Albert Lewandowski
GetInData
ETL
Kubernetes
NiFi
Трек 5: ENG: Cloud and Streaming
How to Fail in AI Business
Mohammad Hossein Noranian
Esra Tech
AI Business
Case Study
Трек 6: ENG: Varia
14:30 - 15:15 (MCK) Нейронные Сети в Анализе и Генерации Звука
Татьяна Зобнина
Naumen
Neural Networks
Sound Analysis
ML Art
Трек 1: RU: Применение
People-driven Company vs Data-driven Company
Алексей Чернобровов
Chernobrovov.com
Data Driven Management
Трек 2: RU: Проекты
The Unbreakable Data Pipeline
Herminio Vazquez
IOVIO
Data Engineering
Data Pipeline
PySpark
Трек 3: ENG: Data
The Intuition Behind Machine Learning In Marketing
Mario A Vinasco
Credit Sesame
ML
Marketing
Advanced Segmentation
Cross Sell Predictions
Трек 4: ENG: Machine Learning
Real-Time Streaming in Any and All Clouds, Hybrid and Beyond
Timothy J Spann
StreamNative
Streaming
Flink
Pulsar
Nifi
Трек 5: ENG: Cloud and Streaming
Trends in 2021 - CRPA, AutoML & the Role of DataOps
Barry Walsh
Pairview Group
ML
DataOps
Trends
Трек 6: ENG: Varia
15:15 - 15:30 (MCK) Вечерний перерыв
15:30 - 16:30 (MCK)
ЗАКЛЮЧИТЕЛЬНАЯ РЕЧЬ:
Embracing #AiFirst Enterprise-Wide
Alex Sanginov
ServiceNow
ML
Enterprise AI
Data Science
(Трек 3)

2-ой день конференции

(29 Cентября)

! Синхронный перевод с английского языка не предусмотрен
(ENG) — доклады на английском языке
(RU) — доклады на русском языке

Время Трек 1: RU: Применение Трек 2: RU: Проекты Трек 3: ENG: Data Трек 4: ENG: Machine Learning Трек 5: ENG: Cloud and Streaming Трек 6: ENG: Varia
08:30 - 09:00 (MCK) Регистрация
09:00 - 10:00 (MCK)
Вступительная речь:
A Code-Driven Introduction to Reinforcement Learning
Phil Winder
Winder Research
Reinforcement Learning
Cyber Security
(Трек 3)
10:05 - 10:50 (MCK) Диагностика Корпоративной Культуры по Лексике Деловой Коммуникации
Марианна Крель & Павел Потеев
Центр Подготовки Руководителей и Команд Цифровой Трансформации ВШГУ РАНХиГС
ML
Linguistic Analysis
Culture Diagnostics Algorithms
Трек 1: RU: Применение
Масштабируем Data Science с помощью Modin
Василий Литвинов
Intel
Data Science
Scalability
Pandas
Трек 2: RU: Проекты
Use Visual Studio Code for Your Machine Learning Environments
Kris van der Mast
VaHa
ML
Visual Studio
Python
Azure
Трек 3: ENG: Data
Neural Networks on the Source Code
Jameel Nabbo
Cybersecurity Researcher, The Netherlands
ML on Source Code
Static Code Analysis
Compilers
Трек 4: ENG: Machine Learning
Management of a Cloud Data Lake in Practice: How to Manage 1000s of ETLs Using Apache Spark
Josef Habdank
DXC Technology
Data Governance
Azure
Spark
Трек 5: ENG: Cloud and Streaming
Industrial Use Cases of Data Science
Sana Rasheed
Accenture
Data Science
Predictive Models
Industry Use Cases
Трек 6: ENG: Varia
10:50 - 11:05 (MCK) Утренний перерыв
11:05 - 11:50 (MCK) NLP или Как Подключить Тысячи Пользователей к Данным
Юрий Ефаров
Easy Report
Natural Language Processing
Data Democratization
Трек 1: RU: Применение
Metadata management light или чем полезна фолксономия
Анастасия Викторова
Mediacom
Metadata Management
Data Catalog
Трек 2: RU: Проекты
Using Service Level Objective Theory to Design Great Data Products
Emily Gorcenski
ThoughtWorks
Reliability Engineering
Data Mesh
AI
Трек 3: ENG: Data
Complex AI Forecasting Methods for Investments Portfolio Optimization
Paweł Skrzypek
Anna Warno
AI Investments
ML
Forecasting
Investing
Трек 4: ENG: Machine Learning
Development of a Kafka-Powered Advanced Stream Commerce Platform
Andrea Spina
Radicalbit
MLOps
Streaming
Kafka
Трек 5: ENG: Cloud and Streaming
Machine Learning Security
Karol Przystalski
Codete
ML
Security
Трек 6: ENG: Varia
11:55 - 12:40 (MCK) Распределенное Хранилище IoT Телеметрии на Базе PostgreSQL и TimescaleDB
Иван Муратов
Первая Мониторинговая Компания
IoT
Time Series
TimescaleDB
PostgreSQL
Трек 1: RU: Применение
Discovery на API-Проектах: с Чего Начать и Чего Ожидать
Ксения Калашникова
Llamazing Data Project
API Discovery
Requirements Management
Трек 2: RU: Проекты
Riding the Second Wave - Open Source for Relational Databases
Jan Karremans
EDB Postgres
Databases
Open Source
PostgreSQL
Трек 3: ENG: Data
Share Massive Amounts of Live Data with Delta Sharing
Frank Munz
Databricks
Data Science
Open Source
Data Sharing
Трек 4: ENG: Machine Learning
Real Time Streaming Data from AWS MSK Kafka to Cloudera
Lidor Gerstel
Centerity
Hadoop
Databases
ETL
NoSQL
Scala
Трек 5: ENG: Cloud and Streaming
Keyword search is dead! And so are Solr and Elasticsearch?
Daniel Wrigley
SHI
Natural Language Processing (NLP)
Vector Similarity Search
Solr
Elasticsearch
Трек 6: ENG: Varia
12:40 - 13:40 (MCK) Обеденный перерыв
13:40 - 14:25 (MCK) Архитектура и Реализация Реляционных Операторов в Распределенных SQL-Движках
Владимир Озеров
Querify Labs
Apache Calcite
SQL
Query Optimization
Трек 1: RU: Применение
Как Начать Продажи Big Data Продукта с Нуля: Три Обязательных Составляющих
Александр Дмитриев
ADV LaunchPad
Big Data Products
Sales
Трек 2: RU: Проекты
Big or Small Data in the Food Industry?
Antía Fernández
Gradiant
Big Data
Data Analytics
Food Industry
Трек 3: ENG: Data
The state of MLOps - machine learning in production at enterprise scale
Bas Geerdink
Aizonic
MLOps
Big Data
Machine Learning
Трек 4: ENG: Machine Learning
Choosing the Right Abstraction Level for Your Kafka Project
Carlos Manuel Duclos-Vergara
Schibsted
Streaming Architecture
Event Processing
Kafka
Трек 5: ENG: Cloud and Streaming
Architecture vs. Operating Model - A Cloud Conundrum
Federico Fregosi
Contino
End-to-End Tests
Developers
Agile Test Automation
Трек 6: ENG: Varia
14:30 - 15:15 (MCK) Использование Методов Машинного Обучения в Задачах Статического Анализа Исполняемых Файлов
Никита Курганов
МГТУ им Н.Э.Баумана
ML
Security
File Analysis
Трек 1: RU: Применение
Как Выбрать Подход к Управлению ML Проектом
Асхат Уразбаев
ScrumTrek
ML
Agile
Scrum
Kanban
Трек 2: RU: Проекты
Building Data Science Products
Valentina Djordjevic
Things Solver
ML
Data Science
Product Development
Трек 3: ENG: Data
Towards Human-AI Teaming: Challenges and Opportunities of Human in the Loop AI Training
Clodéric Mars & Sagar Kurandwad
AI Redefined
ML
Multi-Agent Systems
Reinforcement Learning
Трек 4: ENG: Machine Learning
An Introduction to Streaming SQL with Materialize
Marta Paes
Materialize
Databases
Streaming
SQL
Трек 5: ENG: Cloud and Streaming
Zoom Out: Building a Kickass Engineering Team Remotely
Gad Salner
Melio
Team Management
Agile
Трек 6: ENG: Varia
15:15 - 15:30 (MCK) Вечерний перерыв
15:30 - 16:30 (MCK)
ЗАКЛЮЧИТЕЛЬНАЯ РЕЧЬ:
Translating Data Into Powerful Stories
Juan Venegas
Growth Tribe
Data storytelling
Data Visualisation
(Трек 3)

« Hазад