Big Data Days 2019

 8-10 октября   Москва

Милош Милованович

Things Solver, Сербия

Биография

Милош является соучредителем и одновременно инженером по обработке данных в компании Things Solver, специализирующейся в расширенной аналитике с поддержкой масштабирования. Он обладает всесторонними знаниями в области управления данными и анализа данных. В течение последних нескольких лет Милош успешно ведет внедрение передовых аналитических решений для международных клиентов в различных отраслях промышленности, включая телекоммуникации, банковское дело и розничную торговлю. Он специализируется на управлении и реализации больших данных в условиях промышленного уровня. В компании Things Solver Милош возглавляет команду специалистов в области инженерии данных и принимает участие в повышении их профессионального обучения и развития. Милош также является одним из основателей сообщества Data Science Serbia, ориентированного на обмен знаниями и опытом в области углубленной аналитики.

Доклад

Кому необходимо управление данными?

С быстрым развитием углубленной аналитики и с учетом сжатых сроков выполнения проектов, требуемых бизнес-подразделениям, управление данными часто остается в стороне. Эта среда ведет к формированию неконсолидированного и децентрализованного подхода к аналитическим проектам, где организации не хватает общего представления о цельных бизнес-процессах. Тем не менее некоторая польза от проектов в области анализа и обработки данных извлекается даже в этих условиях. Истинный потенциал заключается в осуществлении комплексного и централизованного подхода к управлению данными в организации. Создание управления данными в масштабах больших данных является достаточно сложной и трудоемкой задачей с двух точек зрения: требует, чтобы разные подразделения сели и договорились об определении данных и каталогах данных, инструментам с открытым исходным кодом по-прежнему не хватает многих необходимых функций для создания корпоративной среды. В этом докладе мы рассмотрим основные требования к средам больших данных для производства с точки зрения управления данными – что они означают с организационной и экономической точки зрения, и как реализовать их в средах на основе Hadoop. Основные функциональные возможности Apache Ranger и Apache Atlas будут рассмотрены на реальных примерах, реализованных в различных проектах, и на примере всей архитектуры и рабочей нагрузки, используемой в реальной среде.

Ключевые слова

Data Management
Data Governance
Advanced Analytics