Модуль транскрипції голосових команд в середовищі автоматичних пристроїв

Автор(и)

  • A. Юдов КПІ ім. Ігоря Сікорського, Ukraine
  • K. Остапченко КПІ ім. Ігоря Сікорського, Ukraine

DOI:

https://doi.org/10.20535/1560-8956.40.2022.261664

Ключові слова:

робот з голосовим керуванням, транскрипція мови, розпізнавання голосу

Анотація

Метою роботи є перевірка ефективності функціонування модуля транскрипції голосових команд в багатомовному середовищі за рахунок визначення параметрів голосового сигналу при роботі модуля. Проведено аналіз підходів для
вирішення задачі з розпізнавання мови у потоці аудіо даних, серед яких акцентовано на розпізнаванні голосового сигналу мовця. У дослідженні використовується голоси з бази Google на різних мовах для підвищення ефективності реалізації голосових команд автоматичного включення/виключення устаткування. Голосові команди здійснюються 9 випадковими мовами залежно від доступності бази Google Voice за допомогою модуля розпізнавання. Аналізується вплив гучності та відстані на продуктивність модуля розпізнавання голосу. Встановлена ефективність і вплив вибору мови команди від відстані між мікрофоном і динаміком у діапазоні приблизно 5 см, 10 см та 15 см, а також гучність голосових команд у Google Voice на 30%, 50% і 100%.

Бібл. 9, іл. 4.

Посилання

Sen, S. Design of an intelligent voice-controlled home automation system / S. Sen, S. Chakrabarty, R. Toshniwal, A. Braumik // International Journal of Computer Applications. 2015. Vol. 121, No 15. Pp. 39-42. DOI: https://doi.org/10.5120/21619-4904

Owens, F. Signal Processing of Speech / F.J. Owens. New York, US: McGraw-Hill Inc, 1993. URL: https://link.springer.com/book/10.1007/978-1-349-22599-6

Kumar, S. An Approach for Automatic Voice Signal Detection (AVSD) using Matlab / S. Kumar, A. Shastri, R.K. Singh // International Journal of Computer Theory and Engineering. 2011. Vol. 3, No 2. Pp. 240-247. DOI: https://doi.org/10.7763/IJCTE.2011.V3.311

Campbell, J.P. Speaker Recognition. In: Jain, A.K., Bolle, R., Pankanti, S. (eds) Biometrics. Springer, Boston, MA., 1996. DOI: https://doi.org/10.1007/0-306-47044-6_8

Kanevsky, D. Speech Transcription Services / D. Kanevsky, S. Basson, S. Chen, A. Faisman, A. Zlatsin // International Conference on Speech and Computer SPECOM-2006. St. Petersburg, 25-29 June 2006. Pp. 37-43. URL https://www.researchgate.net/publication/228738432_Speech_Transcription_Services

Kamdar, H. A review on home automation using voice recognition / H. Kamdar, R. Karkera, A. Khanna, P. Kulkarni, S. Agrawal // International Research Journal of Engineering and Technology. 2017. Vol. 4, No 10. Pp. 1795-1799. URL: https://www.irjet.net/archives/V4/i10/IRJET-V4I10329.pdf

Karudaiyar, G. IOT Based Voice Controlled Smart Home Automation / G. Karudaiyar, S. Bhummireddi, C. Deepak // International Journal of Engineering Applied Sciences and Technology. 2017. Vol. 2, No 5. Pp. 44-45. URL: http://www.ijeast.com/papers/44-45,Tesma205,IJEAST.pdf

EasyVR 3 Plus Manual. RoboTechsrl. URL: https://fortebit.tech/docs/manuals/easyvr-3/ (accessed 14.01.2020)

King, R. Speech and Voice Recognition / R. King // Biometrics Research Group. 2014. URL: https://www.biometricupdate.com/wp-content/uploads/2014/05/VoiceBiometrics.pdf

##submission.downloads##

Опубліковано

2022-07-19