Методи та компоненти обробки природної мови


  • O. Iosifova Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна
  • I. Iosifov Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна
  • O. Rolik Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна



Ключові слова:

NLP, мовна модель, RNN, GRU, LSTM, кодер, декодер, трансфорормер, трансферне навчання, глибоке навчання, нейронна мережа.


В даний час мовні моделі дозволяють забезпечувати високу точність при
вирішенні ряду задач обробки природної мови (natural language processing – NLP). До таких завдань відносяться – машинний переклад, розпізнавання мови, пошук інформації, аналіз настроїв, узагальнення, відповіді на питання, розробка багатомовних діалогових систем і багато іншого. Стаття присвячена дослідженню та аналізу найбільш поширених в даний час методів і конструкцій для побудови і навчання мовних моделей, які дозволяють отримати найкращі результати. Розглядаються методи та компоненти, що застосовуються при створенні мовних моделей та їх частин. Особлива увага приділяється рекурентним нейронним мережам, механізмам представлення словників, архітектурі «кодера» і «декодера», концепції «уваги», а також розпаралелюванню з використанням «Transformer». Встановлено, що найбільш перспективними методами є: попереднє навчання моделей на
великих масивах даних з подальшою тонкою настройкою; нейронні мережі, засновані на увазі, як частині дизайну моделі; складний ансамбль багатовимірних представлень словників для побудови глибокого розуміння контексту. Архітектури, засновані на цих підходах, вимагають великої обчислювальної потужності для навчання моделей, що визначає напрямок подальших досліджень.

Бібл. 49, іл. 13


