Експериментальне дослідження компонентів RAG-системи та їх впливу на ефективність чат-ботів служб підтримки
DOI:
https://doi.org/10.20535/1560-8956.48.2026.351879Ключові слова:
доповнена пошуком генерація, RAG, LangChain, FAISS, чат-бот, векторна база даних, пошук контексту, великі мовні моделіАнотація
У статті представлено експериментальне дослідження компонентів систем типу Retrieval-Augmented Generation (RAG), спрямоване на розробку інтелектуального чат-бота підтримки, здатного працювати зі складними текстовими документтами. У роботі проведено порівняння різних фреймворків, векторних баз даних та стратегій поділу тексту на фрагменти з метою визначення оптимальної конфігурації, яка забезпечує високу точність, повноту контексту та ефективність обробки. Результати експериментів показали, що фреймворк LangChain демонструє найкращі показники точності та повноти контексту порівняно з LlamaIndex, а векторна база FAISS перевершує інші за релевантністю відповідей, достовірністю та швидкістю роботи. Крім того, конфігурація chunk size = 1000 та chunk overlap = 50 забезпечує оптимальний баланс між точністю, повнотою контексту та часом відповіді. Поєднання фреймворку LangChain, бази даних FAISS і параметрів поділу тексту 1000/50 формує ефективну основу для створення високопродуктивного чат-бота підтримки, здатного генерувати точні, достовірні та контекстуально релевантні відповіді у різних прикладних галузях.
Бібл. 9, іл. 1, табл. 5
Посилання
Aslanova V., Oliinyk V. Psychological support assistant based on fine-tuned LLaMA 3 model // The International Conference on Security, Fault Tolerance, Intelligence ICSFTI2024 (June 07, 2024, Kyiv, Ukraine), page 1-13. URL: https://icsfti-proc.kpi.ua/article/view/309532 (application date: 09.06.2025)
Oliinyk V. A comparative study of task formulations for detecting propaganda using Large Language Models/ Oliinyk V., Zakharchyn N. // Адаптивні системи автоматичного управління: міжвідомчий науково-технічний збірник. – 2025. – № 2 (47).
Gao Y., Xiong Y., Gao X., et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv:2312.10997, 2023. DOI: https://doi.org/10.48550/arXiv.2312.10997
Поночовний П.С. Аналітичний огляд способів застосування великих мовних моделей (LLM) для вирішення прикладних задач / Поночовний П.С., Олійник В.В.// Інженерія програмного забезпечення і передові інформаційні технології (Soft Tech2023): матеріали V Міжнародної науково-практичної конференції молодих вчених та студентів, 19-21 грудня 2023 року, м. Київ, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2023. С. 272-276. URL: https://drive.google.com/file/d/1racc22TBKkFFNzBRSzOrePKpFfbnGDJ1/view (дата звернення: 25.10.2025).
Lewis P., Perez E., Piktus A., et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks // arXiv:2005.11401, 2020. DOI: https://doi.org/10.48550/arXiv.2005.11401
Afzal А. Towards Optimizing a Retrieval Augmented Generation using Large Language Model on Academic Data / А. Afzal, J. Vladika, G. Fazlija, A. Staradubets, F. Matthes //. In Proceedings of the 2024 8th International Conference on Natural Language Processing and Information Retrieval (NLPIR '24). – Association for Computing Machinery, New York, NY, USA, 2025. – P. 250–257.
Hladěna J. et al. The Effect of Chunk Size on the RAG //Software Engineering: Emerging Trends and Practices in System Development: Proceedings of 14th Computer Science Online Conference 2025, Volume 2. – Springer Nature, 2025. – P. 317.
Stäbler M. et al. The impact of chunking strategies on domain-specific information retrieval in rag systems //2025 IEEE International Conference on Omni-layer Intelligent Systems (COINS). – IEEE, 2025. – P. 1-6.
Oliinyk V. Low-resource text classification using cross-lingual models for bullying detection in the Ukrainian language / Oliinyk V., Matviichuk І. // Adaptive systems of automatic control, 2023. Vol. 1, №42. – P. 87-100.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
1.Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.