Модуль транскрипції голосових команд в середовищі автоматичних пристроїв
DOI:
https://doi.org/10.20535/1560-8956.40.2022.261664Ключові слова:
робот з голосовим керуванням, транскрипція мови, розпізнавання голосуАнотація
Метою роботи є перевірка ефективності функціонування модуля транскрипції голосових команд в багатомовному середовищі за рахунок визначення параметрів голосового сигналу при роботі модуля. Проведено аналіз підходів для
вирішення задачі з розпізнавання мови у потоці аудіо даних, серед яких акцентовано на розпізнаванні голосового сигналу мовця. У дослідженні використовується голоси з бази Google на різних мовах для підвищення ефективності реалізації голосових команд автоматичного включення/виключення устаткування. Голосові команди здійснюються 9 випадковими мовами залежно від доступності бази Google Voice за допомогою модуля розпізнавання. Аналізується вплив гучності та відстані на продуктивність модуля розпізнавання голосу. Встановлена ефективність і вплив вибору мови команди від відстані між мікрофоном і динаміком у діапазоні приблизно 5 см, 10 см та 15 см, а також гучність голосових команд у Google Voice на 30%, 50% і 100%.
Бібл. 9, іл. 4.
Посилання
Sen, S. Design of an intelligent voice-controlled home automation system / S. Sen, S. Chakrabarty, R. Toshniwal, A. Braumik // International Journal of Computer Applications. 2015. Vol. 121, No 15. Pp. 39-42. DOI: https://doi.org/10.5120/21619-4904
Owens, F. Signal Processing of Speech / F.J. Owens. New York, US: McGraw-Hill Inc, 1993. URL: https://link.springer.com/book/10.1007/978-1-349-22599-6
Kumar, S. An Approach for Automatic Voice Signal Detection (AVSD) using Matlab / S. Kumar, A. Shastri, R.K. Singh // International Journal of Computer Theory and Engineering. 2011. Vol. 3, No 2. Pp. 240-247. DOI: https://doi.org/10.7763/IJCTE.2011.V3.311
Campbell, J.P. Speaker Recognition. In: Jain, A.K., Bolle, R., Pankanti, S. (eds) Biometrics. Springer, Boston, MA., 1996. DOI: https://doi.org/10.1007/0-306-47044-6_8
Kanevsky, D. Speech Transcription Services / D. Kanevsky, S. Basson, S. Chen, A. Faisman, A. Zlatsin // International Conference on Speech and Computer SPECOM-2006. St. Petersburg, 25-29 June 2006. Pp. 37-43. URL https://www.researchgate.net/publication/228738432_Speech_Transcription_Services
Kamdar, H. A review on home automation using voice recognition / H. Kamdar, R. Karkera, A. Khanna, P. Kulkarni, S. Agrawal // International Research Journal of Engineering and Technology. 2017. Vol. 4, No 10. Pp. 1795-1799. URL: https://www.irjet.net/archives/V4/i10/IRJET-V4I10329.pdf
Karudaiyar, G. IOT Based Voice Controlled Smart Home Automation / G. Karudaiyar, S. Bhummireddi, C. Deepak // International Journal of Engineering Applied Sciences and Technology. 2017. Vol. 2, No 5. Pp. 44-45. URL: http://www.ijeast.com/papers/44-45,Tesma205,IJEAST.pdf
EasyVR 3 Plus Manual. RoboTechsrl. URL: https://fortebit.tech/docs/manuals/easyvr-3/ (accessed 14.01.2020)
King, R. Speech and Voice Recognition / R. King // Biometrics Research Group. 2014. URL: https://www.biometricupdate.com/wp-content/uploads/2014/05/VoiceBiometrics.pdf
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.