Big Data Days 2019

 8-10 октября   Москва

Владимир Крылов

Artezio, Россия

Биография

Профессор д.т.н. Владимир Крылов является консультантом по технологиям больших данных и машинного обучения компании Artezio и занимает должность профессора в Национальном исследовательском университете Высшая школа экономики. До 2016 года работал в должности заведующего лабораторией технологий больших данных Нижегородского государственного технического университета. Он был соучредителем и техническим директором MERA Labs LLC. Целью которой было запустить несколько инновационных проектов, в том числе масштабируемое хранилище информации на основе новой запатентованной структуры данных. До того, как основать компанию, Владимир Крылов был региональным менеджером по разработке в корпорации Microsoft, менеджером по исследованиям и разработкам Intel Corporation в России, а также вице-президентом по технологиям совместного российско-американского предприятия TECOM и руководителем всех его исследований и разработок. Владимир Крылов является активным и уважаемым членом научного сообщества. Он действительный член Российской инженерной академии, IEEE, ACM, работал исследовательской комиссии ИК17 МСЭ-Т. Он также работает в совете по присуждению ученых степеней Нижегородского технического университета. Профессор Крылов является автором четырех книг и более 200 статей.

Доклад

Семиотический анализ юридических текстов

В отличие от  семантического анализа LSA, который извлекает имманентные темы из текста, семиотический анализ имеет целью интерпретировать  нарративный текст в терминах заранее определенных умственных конструкций, называемых знаками. Такие задачи создают новую область NLU – Natural Language Understanding. На практике это задачи генерации некоторых формализованных выводов, основанных на описании потока событий. Например, задача найти диагноз заболевания по данным анамнеза. Другим примером является задача установить факт нарушения любого законодательного акта как в уголовном кодексе, так и в гражданском или трудовом законодательстве путем анализа изложения потока событий. Основная идея этой работы состоит в том, что для описании семиотических знаков  используется естественный язык, то есть знаки могут быть представлены как языковые конструкции на том же языке, что и текст для интерпретации. Тогда можно получить оценки глубины интерпретируемости по каждому из знаков, найдя проекции повествования на эти языковые конструкции. То есть мы можем оценить вероятность наличия каждого из знаков в нарративном тексте. Построенная модель исследована с использованием российского уголовного, гражданского и трудового законодательства.

Ключевые слова

Natural Language Understanding
Semiotic Analysis