ДВУХКОМПОНЕНТНАЯ СЕТЕВАЯ МОДЕЛЬ В ТЕХНОЛОГИЯХ ГОЛОСОВОЙ ИДЕНТИФИКАЦИИ ЛИЧНОСТИ

Эдита К. Куулар, Андрей И. Труфанов, Алексей А. Тихомиров

Аннотация


Среди важнейших параметров биометрических систем голосовой модальности, определяющих их эффективность, наряду с надежностью и помехоустойчивостью выделяют скорость идентификации и верификации личности. Данный параметр особенно чувствителен при обработке крупномасштабных баз голосовых данных в режиме реального времени. Многие исследовательские работы в данной области направлены на разработку новых и совершенствование имеющихся алгоритмов представления и обработки речевых записей, обеспечивающих высокую производительность голосовых биометрических систем. Здесь перспективным представляется современный подход к решению сложных объемных задач с большим числом элементов и учетом их взаимосвязей, использующий платформу комплексных сетей. Так, известны работы, в которых при решении задачах анализа и распознавания лиц по фотографиям изображения трансформируются в комплексные сети для последующей их обработки стандартными приемами. Одним из первых применений комплексных сетей в задачах анализа звуковых рядов (музыкальных и речевых) являлось описание их частотных характеристик с помощью построения сетевых моделей – конвертации рядов в сети. На платформе сетевой онтологии в данной работе развит предложенный ранее метод представления аудиоинформации с целью ее высокопроизводительного автоматического анализа и снижения погрешности в распознавании личности – диктора.  Для этого предполагается конвертирование звуковой информации в форму ассоциативной семантической (когнитивной) сетевой структуры, содержащей две компоненты: амплитудную и частотную. Были записаны два речевых примера с последующей их трансформацией в соответствующие сети и сравнением топологических метрик. Набор топологических метрик каждой из сетевых моделей (амплитудной и частотной) представляет собой вектор, а вместе - матрицу, как цифровой "сетевой" отпечаток голоса. Предлагаемый сетевой подход с его чувствительностью к состоянию индивида – физиологическому, психологическому, эмоциональному, может оказаться полезным не только для задач идентификации личности, но и для определения ее состояния.

Ключевые слова


биометрические модальности, звуковая информация, идентификация диктора, комплексные сети, амплитуда, частота.

Полный текст:

PDF

Литература


1 Talreja V., Ferrett M. T., Valenti C., Ross A. Biometrics-as-a-Service: A Framework to Promote Innovative Biometric Recognition in the Cloud. arXiv:1710.09183v1. 2017. -6 p. URL: https://arxiv.org/pdf/1710.09183.pdf (дата обращения: 25.11.17)

2 Goode A. Biometric Identification or Biometric Authentication? URL: https://www.veridiumid.com/blog/biometric-identification-and-biometric-authentication/ (дата обращения: 18.02.16)

3 Ibrahim D.R., Tamimi A.A., Abdalla A.M. Performance Analysis of Biometric Recognition Modalities 8th International Conference on Information Technology (ICIT). Amman, Jordan. 2017. pp. 980-984

4 Матвеев Ю.Н. Технологии биометрической идентификации личности по голосу и другим модальностям. Вестник МГТУ им. Н.Э. Баумана. Сер. "Приборостроение". 2012, C. 46-61

5 Wu J. C., Martin A. F., Greenberg C. S., Kacker R. N. The Impact of Data Dependence on Speaker Recognition Evaluation IEEE/ACM Trans Audio Speech Lang Process. 2017. vol. 25, no.1, pp. 5-18

6 Сорокин В.Н. Распознавание личности по голосу: аналитический обзор. В.Н. Сорокин, В.В. Вьюгин, А.А. Тананыкин. Информационные процессы. 2012. Т. 12, вып. 1. С. 1-30

7 Poddar A., Sahidullah M., Saha G. Performance comparison of speaker recognition systems in presence of duration variability. India Conference (INDICON), 2015 Annual IEEE, 2015 -6 p.

8 Sahidullah M., Saha G. A novel windowing technique for efficient computation of MFCC for speaker recognition. IEEE signal processing letters. 2013. vol. 20. no. 2. pp. 149-152.

9 Bahmaninezhad F., Hansen J.H.L. I-vector/PLDA speaker recognition using support vectors with discriminant analysis. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2017. pp. 5410-5414

10 Yao T., Meng C., Liang H., Jia L. Speaker recognition system based on deep neural networks and bottleneck features. Journal of Tsinghua University (Science and Technology). 2016. vol. 56, no. 11, pp. 1143-1148

11 Shulipa A., Novoselov S., Melnikov A. Approaches for Out-of-Domain Adaptation to Improve Speaker Recognition Performance. A. Ronzhin et al. (Eds.): SPECOM 2016, LNAI 9811.2016. pp. 124-130

12 Reynolds D.A. Gaussian mixture models. Encyclopedia of biometric recognition. Heidelberg: Springer 2015- pp. 827-832

13 Козлов А.В., Кудашев О.Ю., Матвеев Ю.Н., Пеховский Т.С., Симончик К.К., Шулипа А.К. Система идентификации дикторов по голосу для конкурса NIST SRE 2012. Труды СПИИРАН. 2013. Вып. 25. C. 350-370

14 Рахманенко И.А. Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах. Доклады ТУСУРа, Т. 20, № 1, 2017. С. 70-74

15 Идентификация человека по голосу URL: http://infoprotect.net/varia/identifikaciya_po_golosu (дата обращения: 06.11.17)

16 Куулар Э.К., Тихомиров А.А., Труфанов А.И. Идентификация источников звуковой информации методом сетевого анализа. Безопасность информационных технологий 2016. №2 С. 43-48 URL:
https://bit.mephi.ru/index.php/bit/article/view/78/85

17 Yang D., Li X. Bridge time series and complex networks with a frequency-degree mapping algorithm. Proc. IEEE International Symposium on Circuits and Systems (ISCAS). 2012. pp.910-913

18 Bezsudnov I.V., Snarskii A.A. From the time series to the complex networks: the parametric (dynamical) natural visibility graph. Physica. 2014 no. 414 pp. 53-60 arXiv:1208.6365 URL: https://arxiv.org/ftp/arxiv/papers/1208/1208.6365.pdf

19 Zinoviev D. Networks of Music Groups as Success Predictors. arXiv:1709.08995v1. 2017 -6 p. URL: https://arxiv.org/abs/1709.08995 (дата обращения: 04.08.17)

20 Ferretti S. On the Complex Network Structure of Musical Pieces: Analysis of Some Use Cases from Different Music Genres. arXiv:1709.09708v1. 2017 -32 p. URL: https://arxiv.org/abs/1709.09708 (дата обращения: 13.09.17)

21 SpectraPLUS ®. Pioneer Hill Software. [Электронный ресурс] URL: http://www.spectraplus.com/

22 Boccaletti S., Bianconi G., Criado R., Del Genio C.I., Gómez-Gardeñes J., Romance M., Sendiña-Nadal I., Wang Z., Zanin M. The structure and dynamics of multilayer networks. Physics Reports, 2014, no. 544 (1) pp. 1-122

23 Тихомиров А. А., Труфанов А. И., Россодивита А. Модель взаимодействующих стволовых сетей в решении задач топологической устойчивости сложных систем. Безопасность информационных технологий. 2013, №1, с.125-126

24 Ворона В. А., Костенко В. О. Биометрические технологии идентификации в системах контроля и управления доступом. Computational nanotechnology. 2016 вып. 3, с. 224-241




DOI: http://dx.doi.org/10.26583/bit.2018.1.08

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.