НОВЫЙ МЕТОД СТЕГОАНАЛИЗА ТЕКСТОВЫХ ДАННЫХ, ПОЛУЧЕННЫХ КОДИРОВАНИЕМ ДЛИН СЕРИЙ СИНОНИМОВ

Иван В. Нечта

Аннотация


В статье предложен новый метод стегоанализа, выявляющий текст, полученный методом кодирования длин серий синонимов. Анализируемый метод внедрения позволяет сохранять некоторые статистические свойства текста без изменений после внедрения скрытого сообщения. В частности, неизменными остаются: распределение вероятностей бит извлекаемого сообщения и распределение вероятностей использования синонимов текста, что обеспечивает высокую степень скрытности рассматриваемого метода внедрения. В ходе исследования было показано, что внедряемое сообщение изменяет статистическую структуру контейнера, и этот факт используется при стегоанализе. Разработанный стеготест сравнивает распределение вероятностей серий бит (с длиной не более 5 бит) в извлечённом из контейнера сообщении с эталонными распределениями, соответствующими пустому и заполненному контейнеру. Эталонные распределения были получены путём анализа 1000 контейнеров естественного текста, взятых из библиотеки Gutenberg Project. В работе рассматриваются два подхода к получению эталонных распределений. Первый подход предполагает анализ статистики сообщения, извлечённого из контейнера обычным способом (с помощью программы Tyrannosaurus Lex). Второй подход предполагает дополнительное преобразование сообщения в соответствии с анализируемым алгоритмом кодирования длин серий. Экспериментальные результаты позволяют утверждать о большей эффективности первого подхода. В качестве меры близости двух вероятностных распределений используется мера Кульбака-Лейблера. Показано, что реализованный метод позволяет обнаруживать наличие внедрения в контейнере с числом синонимов равным 500, при этом ошибка 1 рода равна 1.5%, ошибка 2 рода – 1.3%. По сравнению с известными аналогами предлагаемый метод имеет более высокую точность анализа при меньшем объёме входных данных.

Ключевые слова


cтегоанализ, метод замены синонимов, tyrannosaurus lex.

Полный текст:

PDF

Литература


1. Simmons G.J. The prisoners problem and the subliminal channel. In Advances in Cryptology Proceedings of Crypto 83. Plenum Press: 1984. P. 51-67.

2. Koluguri A., Gouse S., Reddy P. B. Text steganography methods and its tools. Int. J. Adv. Sci. Tech. Res. 2014. V. 2. No. 4. P. 888-902.

3. Judge J. C. Steganography: past, present, future. Lawrence Livermore National Lab., CA (US), 2001. – №. UCRL-ID-151879.

4. Atallah M. et al. Natural language watermarking: Design, analysis, and a proof-of-concept implementation. Information Hiding. – Springer Berlin/Heidelberg, 2001. P. 185-200.

5. Meral H. M. et al. Natural language watermarking via morphosyntactic alterations. Computer Speech & Language. 2009. V. 23. No. 1. P. 107-125.

6. Grothoff C. et al. Translation-based steganography. International Workshop on Information Hiding. – Springer, Berlin, Heidelberg. 2005. P. 219-233.

7. Stutsman R. et al. Lost in just the translation. Proceedings of the 2006 ACM symposium on Applied computing. – ACM. 2006. P. 338-345.

8. Chapman M., Davida G. Hiding the hidden: A software system for concealing ciphertext as innocuous text. International Conference on Information and Communications Security. – Springer Berlin/Heidelberg, 1997. P. 335-345.

9. Winstein K. Lexical steganography through adaptive modulation of the word choice hash. URL: http://web.mit.edu/keithw/tlex/ (дата обращения: 20.01.2018).
10. Сайт программы «Texto». URL: http://www.nic.funet.fi/pub/crypt/steganography/texto.tar.gz (дата обращения: 20.01.2018).

11. Нечта И.В. Эффективный метод стегоанализа базирующийся на сжатии данных. Вестник СибГУТИ. 2010. №1. C. 50-55.

12. Xiang L. et al. Linguistic steganalysis using the features derived from synonym frequency. Multimedia tools and applications. 2014. V. 71. No. 3. P. 1893-1911.

13. Xiang L. et al. A novel linguistic steganography based on synonym run-length encoding. IEICE transactions on Information and Systems. 2017. V. 100. No. 2. P. 313-322.

14. Нечта И. В. Применение статистического анализа для обнаружения скрытых сообщений в текстовых данных. Вестник СибГУТИ. 2012. №. 1. С. 29-36.

15. Kullback S. Information Theory and statistics. — N. Y.: Dover Publications, 1997. — 399 p.

16. Сайт «Gutenberg Project». URL: http://www.gutenberg.org/wiki/Main_Page (дата обращения: 20.01.2018).




DOI: http://dx.doi.org/10.26583/BIT.2018.2.10

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.