ФИЗИОЛОГИЧЕСКИЕ АСПЕКТЫ ПОСТРОЕНИЯ СОНОГРАММ И РЕКОНСТРУКЦИИ СПЕКТРА ИСКАЖЕННЫХ РЕЧЕВЫХ ВОКАЛИЗМОВ

Михаил В. Алюшин, Александр М. Алюшин, Сергей В. Дворянкин, Никита С. Дворянкин

Аннотация


Целью исследования является обоснование физиологического подхода к спектральному анализу-синтезу речевого сигнала (РС), предполагающему учет уникальных для каждого человека биометрических параметров, обусловленных физической природой его речеобразующего тракта, необходимых для решения задач защиты речевой информации (РИ) от фальсификации и подделок, а также для восстановления речевой разборчивости (РР) на искаженных участках голосовых интерфейсов. Выделены основные группы используемых для этого физических параметров артикуляционной системы человека. Проанализировано влияние непостоянной во времени формы, огибающей гармонических составляющих РС на получаемое частотное разрешение при выполнении кратковременного преобразования Фурье (КПФ, STFT) с взвешивающим окном Гаусса. Представлено сравнение разрешающей способности преобразования Фурье с окном Гаусса при спектральном анализе-синтезе синусоидальных сигналов с различными огибающими функциями. Показана возможность применения полученных результатов для реконструкции гармонической структуры спектра искаженных участков речевых вокализмов (РВ).

Ключевые слова


спектральный анализ-синтез, защита речевой информации, реконструкция речевого сигнала, восстановление разборчивости речи, речевые вокализмы.

Полный текст:

PDF

Литература


1. Дворянкин С.В., Хорев А.А., Козлачков С.Б., Василевская Н.В. Анализ предельных возможностей методов шумопонижения и реконструкции речевых сигналов, маскируемых различными типами помех. Вопросы кибербезопасности. 2024, № 1(59), с. 89–100. URL: https://cyberrus.info/wp-content/uploads/2024/02/vokib-2024-1-st10-s089-100.pdf (дата обращения:13.04.2025).

2. Валорска А.М. Дипфейки и дезинформация. 2020. Кишинев. – ISBN: 978-9975-57-287-3. URL: http://cc.sibimol.bnrm.md/opac/bibliographic_view/745310 (дата обращения:13.04.2025).

3. Дворянкин С.В. Речевая подпись. М.: МТУСИ, 2003. – 238 с.

4. Алюшин А.М., Дворянкин С.В. Анализ перспектив использования фитнес-браслетов в качестве источника биометрической информации при синтезе биоподписи важного документа. Безопасность информационных технологий, [S.l.], т. 31, № 1, с. 63–74, 2024. ISSN 2074-7136.
DOI: 10.26583/bit.2024.1.03. – EDN: NUBHAU.

5. Минаев В.А., Дворянкин С.В., Алюшин А.М. Методы биомаркирования защищаемых объектов. Информация и безопасность. 2023, т. 26, вып. 3, с. 321–328. ISSN 1682-7813. DOI: 10.36622/VSTU.2023.26.3.016. – EDN: TGJKIC.

6. Alyushin A. M., Alyushin V. M., Dvoryankin S. V. and Kolobashkina L. V. A Biologically Inspired Approach to Protecting and Verifying the Authenticity of Important Documents. Biologically Inspired Cognitive Architectures 2023 (BICA 2023), v. 1130, р. 50–55. DOI:10.1007/978-3-031-50381-8_7. – EDN: QBOJXR.

7. Любимов Н.А., Захаров Е.В. Математическая модель акустического речеобразования с подвижными стенками речевого тракта. Акустический журнал. 2016, т. 62, № 2, с. 227.
DOI: 10.7868/S032079191602009X. – EDN: VLPXHH.

8. Hannukainen A., Lukkari T., Malinen J., Palo P. Vowel formants from the wave equation. I. Acoust. Soc. Am. 2007, v.122, no. 1, p. 1–7. DOI: 10.1121/1.2741599.

9. Женило В.Р. Компьютерная фоноскопия. М.: Из-во Академии МВД РФ, 1995. – 208 с.

10. Коберниченко В.Г. Основы цифровой обработки сигналов: учеб. Пособие. М-во науки и высш. образования Рос. Федерации, Урал. федер. ун-т. Екатеринбург: Изд-во Урал. ун-та, 2018. – 150 с. URL: https://djvu.online/file/YQk6Bw1LOSBXi (дата обращения:13.04.2025).

11. McAulay R. and Quatieri T. Speech analysis/synthesis based on a sinusoidal representation. IEEE Transactions on Acoustics, Speech, and Signal Processing. 1986, v. 34, no. 4, p. 744–754.
DOI: http://dx.doi.org/10.1109/TASSP.1986.1164910.

12. Бонч-Бруевич А.М., Козлачков С.Б. и др. Интерпретация и контурный анализ спектрограмм звуковых сигналов в процессе их шумоочистки. Проблемы информационной безопасности. Компьютерные системы. 2015, № 3, c. 88–99. – EDN: UHSQIF.

13. Дворянкин С.В., Антипенко А.О. Применение фазовых характеристик голосовых вокализмов в решении задач защиты речевой информации. Безопасность информационных технологий, [S.l.], т. 28, № 2, с. 21–33, 2021. ISSN 2074-7136. DOI: 10.26583/bit.2021.2.02. – EDN: JXRJXI.

14. Дворянкин С.В., Макаров Ю.К., Хорев А.А. Обоснование критериев эффективности защиты речевой информации от утечки по техническим каналам. Защита информации. 2007, № 2(14), c. 18–25. – EDN: TRKKQR.

15. Калинцев Ю.К. Разборчивость речи в цифровых вокодерах. М.: Радио и связь. 1991. – 220 с.




DOI: http://dx.doi.org/10.26583/bit.2025.2.03

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.