УДК 621.317+681.849
В.І. СОЛОВЙОВ,
Компанія «Сілентіум Систем», Ванкувер, Канада,
edemsvi@gmail.com
О.В. РИБАЛЬСЬКИЙ,
Національна академія внутрішніх справ, Київ, Україна,
rov_1946@ukr.net
В.В. ЖУРАВЕЛЬ,
Київський науково-дослідний експертно-криміналістичний центр МВС України, Київ,
Україна,
fonoscopia@ukr.net
О.М. ШАБЛЯ,
Одеський науково-дослідний інститут судових експертиз Міністерства юстиції України, Одеса, Україна,
alik_shablya@gmail.com
Є.В. ТИМКО,
Київський науково-дослідний інститут судових експертиз Міністерства юстиції України, Київ, Україна,
e.tymko@kndise.gov.ua
НАДЛИШКОВІСТЬ ІНФОРМАЦІЇ У ПОБУДОВІ СИСТЕМ
ЕКСПЕРТИЗИ ЗВУКОВИХ СИГНАЛІВ НА НЕЙРОННИХ
МЕРЕЖАХ ГЛИБОКОГО НАВЧАННЯ
Анотація. Описано методи попереднього оброблення сигналів, які використовують для створення нового
інструментарію експертизи матеріалів і засобів цифрового звукозапису. Показано, що застосування надлишковості інформації
у створенні бази навчання нейронних мереж глибокого навчання, які використовуються для цієї експертизи,
забезпечує підвищення ефективності ідентифікації диктора за параметрами характеристик голосу приблизно на 15 %.
Підтверджено, що запропоновані методи оброблення забезпечили можливість ідентифікації диктора за фонограмами тривалістю від 1 с.
Ключові слова: вейвлет Морле, часове вікно, часо-частотне перетворення, диктор, ідентифікація, надлишковість, нейронна мережа, спектр, фонограма.
ПОВНИЙ ТЕКСТ
СПИСОК ЛІТЕРАТУРИ
- Solovyov V.I., Rybalskiy O.V., Zhuravel V.V., Semenova N.V. Analyzing the models of speech recognition on the basis of neural networks of deep learning for examination of digital phonograms. Cybernetics and Systems Analysis. 2021. Vol. 57, N 1. P. 133–138. https://doi.org/10.1007/s10559-021-00336-y.
- Соловьев В.И., Рыбальский О.В., Журавель В.В., Железняк В.К. Применение нейронных сетей глубокого обучения для выявления монтажа цифровых фонограмм. Известия Национальной академии наук Белоруссии. Сер. физико-технические науки. 2020. Т. 65, № 4. С. 506–512. https://doi.org/10.29235/1561-8358-2020-65-4-506-512.
- Solovyov V.I., Rybalskiy O.V., Zhuravel V.V. Method of exposure of signs of the digital editing in phonograms with the use of neuron networks of the deep learning. Journal of Automation and Information Sciences. 2020. Vol. 52, Iss. 1. P. 22–28. https://doi.org//10.1615/JAutomatInfScien.v52.i1.30.
- Solovyov V.I., Rybalskiy O.V., Zhuravel V.V. Substantiating the fundamental fitness of deep learning neural networks for construction of a phonogram digital processing detection system. Cybernetics and Systems Analysis. 2020. Vol. 56, N 2. P. 326–330. https://doi.org//10.1007/s10559-020-00249-2.
- Lei Y., Scheffer N., Ferrer L., McLaren M. A novel scheme for speaker recognition using a phonetically-aware deep neural network. Proc. 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (4–9 May 2014, Florence, Italy). Florence, 2014. P. 1695–1699.
- Kenny P., Gupta V., Stafylakis T., Ouellet P., Alam J. Deep neural networks for extracting Baum–Welch statistics for speaker recognition. Proc. Odyssey 2014: The Speaker and Language Recognition Workshop (16–19 June 2014, Joensuu, Finland). Joensuu, 2014. P. 293–298. URL: http://cs.uef.fi/odyssey2014/program/pdfs/28.pdf.
- Kassin S.M., Dror I.E., Kukucka J. The forensic confirmation bias: Problems, perspectives, and proposed solutions. Journal of Applied Research in Memory and Cognition. 2013. Vol. 2, Iss. 1. P. 42–52.
- Singh S. Forensic and automatic speaker recognition system. International Journal of Electrical and Computer Engineering (IJECE). 2018. Vol. 8, N 5. P. 2804–2811.
- Amali Mary Bastina A., Rama N. Biometric identification and authentication providence using fingerprint for cloud data access. International Journal of Electrical and Computer Engineering. 2017. Vol. 7, Iss. 1. P. 408–416.
- Hansen J.H.L., Hasan T. Speaker recognition by machines and humans. IEEE Signal Processing Magazine. 2015. Vol. 32, Iss. 6. P. 74–99.
- Фланаган Дж.Л. Анализ, синтез и восприятие речи. Москва: Связь, 1968. 397 с.
- Фант Г. Акустическая теория речеобразования. Москва: Наука, 1964. 284 с.
- Mallat S. A wavelet tour of signal processing. New Yогk: Асаdemic Ргеss, 1999. 671 p.
- Александров Ю.И. Психофизиология. Москва; Санкт-Петербург: Наука, 2006. 463 с.
- Бехтерева Н.П. Психоакустические аспекты восприятия речи. Механизмы деятельности мозга. Москва: Наука, 1988. 504 с.