Експериментальне дослідження компонентів RAG-системи та їх впливу на ефективність чат-ботів служб підтримки

Автор(и)

  • В. Олійник Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0002-4647-2658
  • П. Поночовний Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0009-0008-1932-8395

DOI:

https://doi.org/10.20535/1560-8956.48.2026.351879

Ключові слова:

доповнена пошуком генерація, RAG, LangChain, FAISS, чат-бот, векторна база даних, пошук контексту, великі мовні моделі

Анотація

У статті представлено експериментальне дослідження компонентів систем типу Retrieval-Augmented Generation (RAG), спрямоване на розробку інтелектуального чат-бота підтримки, здатного працювати зі складними текстовими документтами. У роботі проведено порівняння різних фреймворків, векторних баз даних та стратегій поділу тексту на фрагменти з метою визначення оптимальної конфігурації, яка забезпечує високу точність, повноту контексту та ефективність обробки. Результати експериментів показали, що фреймворк LangChain демонструє найкращі показники точності та повноти контексту порівняно з LlamaIndex, а векторна база FAISS перевершує інші за релевантністю відповідей, достовірністю та швидкістю роботи. Крім того, конфігурація chunk size = 1000 та chunk overlap = 50 забезпечує оптимальний баланс між точністю, повнотою контексту та часом відповіді. Поєднання фреймворку LangChain, бази даних FAISS і параметрів поділу тексту 1000/50 формує ефективну основу для створення високопродуктивного чат-бота підтримки, здатного генерувати точні, достовірні та контекстуально релевантні відповіді у різних прикладних галузях.

Бібл. 9, іл. 1, табл. 5

Посилання

Aslanova V., Oliinyk V. Psychological support assistant based on fine-tuned LLaMA 3 model // The International Conference on Security, Fault Tolerance, Intelligence ICSFTI2024 (June 07, 2024, Kyiv, Ukraine), page 1-13. URL: https://icsfti-proc.kpi.ua/article/view/309532 (application date: 09.06.2025)

Oliinyk V. A comparative study of task formulations for detecting propaganda using Large Language Models/ Oliinyk V., Zakharchyn N. // Адаптивні системи автоматичного управління: міжвідомчий науково-технічний збірник. – 2025. – № 2 (47).

Gao Y., Xiong Y., Gao X., et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv:2312.10997, 2023. DOI: https://doi.org/10.48550/arXiv.2312.10997

Поночовний П.С. Аналітичний огляд способів застосування великих мовних моделей (LLM) для вирішення прикладних задач / Поночовний П.С., Олійник В.В.// Інженерія програмного забезпечення і передові інформаційні технології (Soft Tech2023): матеріали V Міжнародної науково-практичної конференції молодих вчених та студентів, 19-21 грудня 2023 року, м. Київ, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2023. С. 272-276. URL: https://drive.google.com/file/d/1racc22TBKkFFNzBRSzOrePKpFfbnGDJ1/view (дата звернення: 25.10.2025).

Lewis P., Perez E., Piktus A., et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks // arXiv:2005.11401, 2020. DOI: https://doi.org/10.48550/arXiv.2005.11401

Afzal А. Towards Optimizing a Retrieval Augmented Generation using Large Language Model on Academic Data / А. Afzal, J. Vladika, G. Fazlija, A. Staradubets, F. Matthes //. In Proceedings of the 2024 8th International Conference on Natural Language Processing and Information Retrieval (NLPIR '24). – Association for Computing Machinery, New York, NY, USA, 2025. – P. 250–257.

Hladěna J. et al. The Effect of Chunk Size on the RAG //Software Engineering: Emerging Trends and Practices in System Development: Proceedings of 14th Computer Science Online Conference 2025, Volume 2. – Springer Nature, 2025. – P. 317.

Stäbler M. et al. The impact of chunking strategies on domain-specific information retrieval in rag systems //2025 IEEE International Conference on Omni-layer Intelligent Systems (COINS). – IEEE, 2025. – P. 1-6.

Oliinyk V. Low-resource text classification using cross-lingual models for bullying detection in the Ukrainian language / Oliinyk V., Matviichuk І. // Adaptive systems of automatic control, 2023. Vol. 1, №42. – P. 87-100.

##submission.downloads##

Опубліковано

2026-02-09