Big Data Moscow 2018

Вадим Челышков

Microsoft, Россия

Биография

В 2013 году закончил МИЭМ НИУ ВШЭ по специальности «Информационные системы». Основной род деятельности в прошлом – разработка для .NET и управлением проектами в области IT. В настоящее время является техническим специалистом по системам бизнес-аналитики и сервисам платформы Azure. С 2015 года помогает заказчикам Microsoft внедрять технологии машинного обучения/анализа данных и реализовывать проекты в различных индустриях (Telco, Oil&Gas, Retail).

Доклад

Azure Databricks – больше, чем просто Apache Spark на стероидах

Azure Databricks — это быстрая и удобная служба аналитики на основе Apache Spark, разработанная в UC Berkeley. Она предназначена для совместной работы и позволяет ускорить анализ больших данных, т.к. вы за считаные минуты можете создать cвою среду Spark и в автоматическом режиме изменять размер кластера.
Поддержка Python, Scala, R и SQL, а также таких платформ и библиотек глубокого машинного обучения, как TensorFlow, Pytorch и Scikit-learn, позволяет применять уже имеющиеся навыки и умения.
В ходе доклада мы ознакомимся с основными отличиями и ключевыми преимуществами продукта по сравнению с «классическим» Apache Spark.

Дата: 11 октября, 2018