Big Data Days 2019

 8-10 октября   Москва

Подтверждённые доклады

подтверждённые доклады на данный момент

Эрик Джонсон

Amazon Web Services, США

Доклад

Большые «облачные» данные

Поскольку AWS Lambda был анонсирован в 2014 году, внесерверная обработка данных работает с использованием технологии, лежащей в основе web и мобильных приложений, интернета вещей, навыков Alexa, и многого другого. Приложения с использованием больших данных также не остались в стороне от этого сдвига в парадигме. В них произошли значительные улучшения в отношении получения и обработки, маршрутизации, анализа в режиме реального времени и хранения данных на основе внесерверных технологий.

Читать больше…

AWS
Serverless

Михаил Петров

Счетная палата Российской Федерации, Россия

Доклад

Культура работы с данными как часть цифровой трансформации– задачи и решения

Культура работы с данными в компании – один из важнейших факторов успеха.
Как изменить культуру и встать на путь трансформации? Необходимо правильно определить ключевые шаги, собрать команду изменений, найти «агентов преобразований», наметить «быстрые победы», подкрепить все планом мотивации и обучения, определиться с источниками данных и их пригодностью для работы.

Читать больше…

культура
трансформация
мотивация
качество данных

Арно Бройкхоф

Dataworkz, Голландия

Доклад

Анализ и обработка данных как услуга

Сегодня почти каждый обсуждает анализ и обработку данных / машинное обучение, контейнеры, облако и переход к бессерверным решениям.
А что если объединить все эти элементы в единую среду микрослужб? Звучит неплохо?!
В этом докладе я поделюсь своими мыслями на этот счет, а также продемонстрирую указанные ниже действия.

Читать больше…

Бессерверный
Машинное обучение
Облако

Владимир Дмитриев

Visiology, Россия

Доклад

Ключ к успеху Data Science проектов в промышленности и не только

Все больше компаний встают сегодня на путь цифровой трансформации, делая ставку на исследовании данных (Data Science) для получения новых знаний путем глубокого анализа накопленных массивов корпоративной информации. Предприятия уже давно присматриваются к новым методам работы с «большими данными», как к способам извлечения дополнительной выгоды ,и пилотируют проекты машинного обучения.

Читать больше…

Data Science in Manufacturing
Project Management

Елена Герасимова

Нетология, Россия

Доклад

Выбор образовательной траектории и роадмэп трансформации карьеры

Сегодня рынок аналитики устроен так, что если ты не будешь постоянно развиваться и узнавать новые инструменты, ты не сможешь двигаться по карьере. Но даже если ты принял решение расти в новом направлении, чаще всего ты не знаешь, какую образовательную траекторию выбрать. За что взяться? Как найти нужную информацию? И насколько долго затянется это образование?

Читать больше…

Career
Transformation
Road Map

Сергей Шопик

Лаборатории Клиентского опыта, Беларусь

Доклад

С чего начать анализ данных о Клиентах и не потеряться в Big data

С чего начать анализ данных, как заставить данные “заговорить”, как поэтапно погружаться в процесс и увеличивать эффективность на всех этапах работы с Клиентом. Какие данные нам необходимы для этого, как на основе данных выстроить эффективную работу с своими Клиентами. Доклад в формате «пошаговой» инструкции с понятным описанием шагов, что и зачем необходимо делать.

Читать больше…

Анализ данных
Сегментация и персонализация работы

Андрей Шагалов

Artezio, Россия

Доклад

Машинное обучение в музыке и искусстве

Мечтают ли андроиды об электрогитарах? Как я учил нейросеть писать музыку. В марте 2019го года звукозаписывающая компания Warner Music стал первым в мире лейблом, который заключил музыкальный контракт с искусственным интеллектом, точнее с компанией Endel. Warner Music купила права на 20 альбомов созданных алгоритмом. Музыка, создаваемая при помощи ИИ – уже не теория, а вполне себе существующая практика нашей жизни.

Читать больше…

Музыка
Машинное обучение
Google Magenta
Доклад

Эффективный поиск данных в Lyft с помощью Amundsen

Прежде чем начать какой-либо анализ, специалисту по обработке данных необходимо найти подходящие источники данных, чтобы проанализировать их, понять и определить их надежность. К сожалению, на сегодняшний день эффективность обнаружения данных крайне невысока. На поиск подходящих данных тратится бесчисленное количество часов.
Проверка надежности данных требует выполнения огромного количества запросов (максимальная временная отметка, количество за день, количество различающихся и т. д.), которые отнимают время и приводят к возникновению ошибок.

Читать больше…

Обнаружение данных
Открытый код
GDPR

Павел Якунин

ТехЦентр Дойче Банка, Россия

Денис Гойхбург

ТехЦентр Дойче Банка, Россия

Доклад

Как мы в ТехЦентре Дойче банка строим BI на Clickhouse и обеспечиваем доступ к данным на уровне вплоть до отдельных событий

Мы хотели построить BI систему, в которой трейдеры, сейлзы и аналитики могли бы использовать большие данные инвестбанка для ежедневного принятия решений, соблюдая при этом внутренние правила и требования регуляторов. Система должна была быть безопасной и соответствовать требованиям по защите данных в различных странах и правилам контроля доступа. В то же время мы стремились построить подходящую для исследований систему, обеспечивающую минимальное время от сбора данных до принятия решения.

Мы расскажем про путь, который мы прошли за два года, как нам помогли в этом Clickhouse и Spark, и чего нам стоило сделать систему безопасной.

Читать больше…

Business Intelligence
Data Access Control
Clickhouse

Сергей Золотарев

Arenadata, Россия

Доклад

Построение коорпоративных платформ данных на базе Open Source

Сегодня все больше крупнейших компаний при построении корпоративной платформы данных или как его еще называют корпоративного Data Lake используют проекты с открытым кодом ( Open Source) . У такого подхода помимо явных преимуществ в виде использования инновационных продуктов и технологий для решения самого разнообразного списка сценариев по работе с данными есть масса вопросов, на которые надо обращать внимание – как интегрировать компоненты платформы между собой, как со временем сохранить эту интеграцию, как централизованно управлять всеми компонентами платформы, как осуществлять поддержку и эксплуатацию, какие есть типовые риски и особенности использования Open Source.

Читать больше…

Open Source