Big Data Days 2021

Online Edition

28-30 Cентября

онлайн

Алексей Бурнаков

Старший Аналитик Данных

Россия, ТАСС

Биография

Data Scientist, аналитик с опытом в этой сфере 15 лет. Любимые направления: статистика, NLP, классическое машинное обучение.

Доклад

Обнаружение Плагиата в Новостях

Новости ТАСС и других информационных агентств цитируются многими новостными СМИ. Обычно при использовании новости, созданной в информ. агентстве делается явная ссылка на источник. Но иногда СМИ могут пренебречь этим правилом. Такие случаи также нарушают юридические условия использования материалами информ. агентства. В ТАСС мы разработали подход для детекции подобных нарушений — плагиат в новостях СМИ.

Ключевые слова

NLP
Hadoop
Plagiarism

« Hазад