ПОСТРОЕНИЕ ПРОГРАММНОГО МОДУЛЯ СЕГМЕНТАЦИИ РЕЧИ НА ОСНОВЕ АНАЛИЗА ИЗМЕНЕНИЯ СПЕКТРА

О. Б. Зельманский; А. Г. Давыдов

ПОСТРОЕНИЕ ПРОГРАММНОГО МОДУЛЯ СЕГМЕНТАЦИИ РЕЧИ НА ОСНОВЕ АНАЛИЗА ИЗМЕНЕНИЯ СПЕКТРА

О. Б. Зельманский, А. Г. Давыдов

Аннотация

Сегментация речевого сигнала заключается в разбиении данного сигнала на участки однородных колебаний, которые соответствуют разным типам фонем. Модуль сегментации речи является одним из основных компонентов систем синтеза речеподобных сигналов, используемых для защиты акустической информации от утечки по техническим каналам. Рассмотрен метод построения модуля сегментации речи на основе анализа изменения спектра.

Ключевые слова

сегментация речи; фонетическая единица; классификация речи; детектирование речи; цифровая обработка сигналов; спектральный анализ сигнала; кепстр сигнала

Полный текст:

PDF

Литература

1 Зельманский О. Б., Давыдов А. Г. Подходы к решению задачи сегментирования речи в рамках разработки генератора речеподобных сигналов // Современные проблемы радиотехники и телекоммуникаций: материалы МНТК. Севастополь, 2010. С. 386.

2 Ganapathiraju A., Hamaker J., Picone J., Doddington G. R., Ordowski M. Syllable-Based large vocabulary continuous speech recognition // IEEE Transactions on Speech and AudioProcessing. 2001. Vol. 9. № 4. P. 358—366.

3 Kamakshi P., Nagarajan, Hema M. Automatic segmentation of continuous speech using minimum phase group delay functions // Speech Communication. 2004. Vol. 42. P. 429—446.

4 Цыплихин А. И., Сорокин В. Н. Сегментация речи на кардинальные элементы // Информационные процессы. 2006. Том 6. № 3. С. 177-207.

5 Flammia G. [et al.] Segment based variable frame rate speech analysis and recognition using a spectral variation function // Interspeech 1992 — ICSLP: Proceedings of the second international conference on spoken language processing, Banff, Alberta, October 13—16, 1992. Banff, Alberta, Canada, 1992. P. 983—986.

6 A study on spectral variation functions applied to speech signals: final report / Aalborg University; Nouza, J. CPK. 1994. № 4678.

7 Зельманский О. Б., Давыдов А. Г. Система генерирования речеподобных сигналов для маскирования акустической информации // СВЧ-техника и телекоммуникационные технологии: материалы МНТК. Киев, 2010. С. 506—507.

8 Зельманский О. Б., Давыдов А. Г. Параметризация речевого сигнала в системах сегментации речи // Информационные системы и технологии (IST’2010): материалы VI Международной конф. Минск, 24—25 ноября 2010 г. / Науч.-технолог. ассоциация «Инфопарк»; редкол.: А. Н. Курбацкий [и др.]. Минск: А. Н. Вараксин, 2010. С. 163—166.

9 Маркел Д. Д., Грэй А. Х. Линейное предсказание речи. М.: Связь, 1980. — 308 с.

10 Itakura F. Line spectrum representation of linear predictor coefficients of speech signals // Acoustical society of America. 1975. Vol. 57. № 1. P. 77—86.

11 Ланнэ А. А. Новая теория линейных спектральных корней // Третья Международная конференция «Цифровая обработка сигналов и ее применение»: сборник трудов. Москва, 29 ноября — 1 декабря 2000 г. / РНТОРЭС им. А. С. Попова. М., 2000. С. 118—125.

12 Калюжный А. Я., Семенов В. Ю. Автоматическое определение пола диктора на основе гауссовых смесей // Акустический симпозиум «Консонанс-2009»: сборник тезисов конференции. Киев, 29 сентября — 1 октября 2009 г. / НАН Украины, Институт гидромеханики; редкол.: В. Т. Гринченко [и др.]. Киев, 2009. — 31 с.

13 Граничин О. Н., Шалымов Д. С. Решение задачи автоматического распознавания отдельных слов речи при помощи рандомизированного алгоритма стохастической аппроксимации // Нейрокомпьютеры: разработка, применение. 2009. № 3. С. 58—64.

14 Petek B., Andersen O., Dalsgaard P. On the robust automatic segmentation of spontaneous speech // Proc. ICSLP. 1996. P. 913—916.

Ссылки

На текущий момент ссылки отсутствуют.

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.

Безопасность информационных технологий

ISSN: 2074-7128 (Print); ISSN: 2074-7136 (On-Line)