Mit jelent a RAG?
A RAG (Retrieval-Augmented Generation), magyarul visszakereséses generálás, egy AI architektúra, amelyben a nagy nyelvi modell (LLM) válaszadás előtt kikeres releváns információkat egy külső tudásbázisból, és ezek alapján válaszol — nem pedig pusztán abból, amit a betanítása során megtanult.
Egyszerű analógia: ahelyett, hogy a modell „emlékezetből" válaszol (mint egy szóbeli vizsga), egy nyitott könyves vizsgán dolgozik — minden válasz előtt belenézhet a céged dokumentumaiba, korábbi e-mailjeibe, termékkatalógusába, és ezekből válogat.
Hogyan működik?
A RAG három lépésből áll:
- Indexelés (egyszer, előre): a vállalati dokumentumokat (korpusz) feldaraboljuk kisebb darabokra, és mindegyiket embedding formájában — egy számvektor formájában — tároljuk egy vektor-adatbázisban.
- Visszakeresés (kérdéskor): amikor a felhasználó feltesz egy kérdést, a rendszer kiszámolja a kérdés vektorát, majd kikeresi a tudásbázisból azt a 3-10 leginkább releváns dokumentumdarabot.
- Generálás: ezeket a dokumentumdarabokat a prompt-ba beillesztve odaadja az LLM-nek azzal az utasítással, hogy „ezek alapján válaszolj".
A modell így nem találgat — ha az adott információ nincs benne a tudásbázisban, ezt jelzi.
Üzleti példa
Egy magyar pénzügyi tanácsadó iroda 250+ oldalas belső dokumentációt halmozott fel az évek során: termékleírások, jogszabályi értelmezések, korábbi ügyféleseteknek összefoglalói. Egy új tanácsadó betanítása 3-4 hónap volt, mire ki tudta szolgálni az ügyfeleket önállóan.
A RAG-alapú belső asszisztens a teljes dokumentációt megkapta tudásbázisként. Az új kollégák kérdezhetnek tőle (pl. „Mi a teendő, ha az ügyfél 60 napra szeretné a rögzített kamatot?"), és a rendszer a tényleges belső dokumentumokra hivatkozva válaszol, megadva a forrást is. A betanítási idő 3-4 hónapról 6 hétre csökkent.
Miért fontos a RAG egy cégnek?
Két dolog miatt:
- Megbízhatóság. A RAG drasztikusan csökkenti az AI hallucinációt — a modell nem találgat, csak a megadott források alapján válaszol. Ez kritikus jogi, pénzügyi vagy egészségügyi kontextusban.
- Testreszabottság fine-tuning nélkül. Egy LLM újratanítása költséges és lassú. A RAG-gal ugyanazt az általános modellt a saját adataidra tudod hangolni — sokszor olcsóbban, gyorsabban, és úgy, hogy frissíteni is könnyű (csak a dokumentumokat kell cserélni, nem a modellt).
A RAG ma a legnépszerűbb módja annak, hogy egy cég a saját adataival használjon AI-t. Egy jól megtervezett RAG-rendszer 6-8 hét alatt élesíthető, és pillanatokon belül elkezd időt megtakarítani.