Big Data Days 2019

 8-10 октября   Москва

Павлов Дмитрий

Аренaдата, Россия

Андрей Коняев

Аренaдата, Россия

Дата

8 октября, 2019

}

Время проведения

10:00-17:00

Язык проведения

Русский

Павлов Дмитрий

С 2009 года тесно работаю с масштабными кластерными системами, начиная с высокопроизводительных GPU-ориентированных кластеров и заканчивая распределёнными аналитическими СУБД. С 2013 по 2017 руководил отделом эксплуатации Корпоративного Хранилища Данных банка Тинькофф. С 2017 строю высоконагруженные аналитические системы для моих любимых заказчиков.
Моя сфера интереса включает, но не ограничивается: аналитические СУБД, мониторинг и визуализация, потоки данных, кейсы аналитических систем.

Андрей Коняев

Владелец продукта с восьмилетним стажем в BigData. Экспертиза в построении систем хранения и обработки данных, а также прикладных приложений. Основаная специализация – ClickHouse, работаю в формате консалтинга, интеграций, также вношу доработки в open-source репозиторий ClickHouse.

Мастер-класс

Корпоративная платформа данных на open-source компонентах: просто как раз-два-три

Последние несколько лет в сфере корпоративных хранилищ данных (КХД) лучше всего описываются одним словосочетанием: игра изменилась. В противовес моно-вендорным решениям прошлого современный data-ландшафт представлен не единственной системой-серебряной пулей, и даже не несколькими системами от одного вендора. Бизнес, желающий получать конкурентное преимущество из доступных ему данных, вынужден использовать десятки, если не сотни, различных компонентов и систем, каждый из которых эффективно решает свою узкую задачу.

Одновременно с этим растёт тенденция отказа от решений vendor lock-in – теперь компании всё чаще выбирают решения с открытым исходным кодом. Это позволяет диверсифицировать риски подрядных организаций и вендоров, одновременно с этим открывая двери для накопления внутренней экспертизы по технологиям с последующей самостоятельной их поддержкой.

При этом всё больше заметен ещё один тренд – всё больше компаний в качестве инфраструктуры своего ландшафта вместо собственных мощностей выбирают облака, при этом если несколько лет назад это были в основном приватные инсталляции, то сейчас виден перевес в сторону публичных. Каждый такой облачный провайдер несёт за собой свои технологии виртуализации, сети и другую специфику.

Такое количество технологий в одном ландшафте поднимает вопрос компетенций: где взять необходимое количество опытных специалистов по каждой из технологий? Как научиться развёртывать и эксплуатировать разношерстный data-ландшафт эффективно, при этом оставаясь в рамках заложенных бюджетов?

Ответ ищете в этом мастер-классе.

Программа

  • Концепция платформы данных
  • Концепция разделения приложений и инфраструктуры
  • Установка и запуск Arenadata Cluster Manager
  • Основы работы с Arenadata Cluster Manager (создание хостов, кластера, безопасность)
  • Развёртывание кластера мониторинга
  • Развёртывание кластера Greenplum
  • Развёртывание кластера Clickhouse
  • Интеграция кластеров

Цели

  • Знакомство с концепцией платформы данных
  • Практический опыт промышленного развертывания двух ведущих кластерных СУБД с открытым исходным кодом
  • Базовые навыки администрирования СУБД в контексте КХД

Целевая аудитория

Специалисты, связанные с построением и эксплуатацией систем хранения и обработки больших данных в условиях крупных предприятий:

  • Архитекторы
  • Разработчики
  • Администраторы
  • Инженеры
  • Аналитики

Предварительные условия курса

Не требуется – развёртывание будет происходить на стенде.