ИДЕНТИФИКАЦИЯ ИСПОЛНИТЕЛЯ ТЕКСТОВ ПО ЧАСТОТНО-ГРАММАТИЧЕСКИМ ХАРАКТЕРИСТИКАМ И СИНТАКСИЧЕСКИМ ОСОБЕННОСТЯМ
Аннотация
Предложен подход к идентификации исполнителя текстов с помощью исследования частотных грамматических характеристик текста и выявления синтаксических особенностей. Подход применим, когда имеется один или более текстов, для которых точно известен исполнитель, и требуется установить, является ли он исполнителем каких-либо других текстов. Идентификация осуществляется средствами машинного обучения. При этом обучающей выборкой являются тексты с установленным исполнителем, а исследуемые подаются на вход.
Ключевые слова
идентификация; грамматика; синтаксис; машинное обучение; информационная безопасность
Полный текст:
PDFЛитература
1 Кулик С. Д., Ткаченко К. И., Лукьянов И. А. Методы морфологического анализа слов русского языка в системе фактографического вопросно-ответного поиска по законодательной и нормативной документации // Сборник трудов XIX Международной конференции «Информатизация и информационная безопасность правоохранительных органов», 25—26 мая 2010 г. М.: Академия управления МВД России, 2010. С. 377—381.
Ссылки
- На текущий момент ссылки отсутствуют.
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.