ИДЕНТИФИКАЦИЯ ИСПОЛНИТЕЛЯ ТЕКСТОВ ПО ЧАСТОТНО-ГРАММАТИЧЕСКИМ ХАРАКТЕРИСТИКАМ И СИНТАКСИЧЕСКИМ ОСОБЕННОСТЯМ

С. Д. Кулик, К. И. Ткаченко, И. А. Лукьянов

Аннотация


Предложен подход к идентификации исполнителя текстов с помощью исследования частотных грамматических характеристик текста и выявления синтаксических особенностей. Подход применим, когда имеется один или более текстов, для которых точно известен исполнитель, и требуется установить, является ли он исполнителем каких-либо других текстов. Идентификация осуществляется средствами машинного обучения. При этом обучающей выборкой являются тексты с установленным исполнителем, а исследуемые подаются на вход.

Ключевые слова


идентификация; грамматика; синтаксис; машинное обучение; информационная безопасность

Полный текст:

PDF

Литература


1 Кулик С. Д., Ткаченко К. И., Лукьянов И. А. Методы морфологического анализа слов русского языка в системе фактографического вопросно-ответного поиска по законодательной и нормативной документации // Сборник трудов XIX Международной конференции «Информатизация и информационная безопасность правоохранительных органов», 25—26 мая 2010 г. М.: Академия управления МВД России, 2010. С. 377—381.


Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.