ai RAG - ghdrako/doc_snipets GitHub Wiki
RAG = Retrieval-Augmented Generation
To architektura łącząca dwa podejścia:
- Retrieval – wyszukiwanie informacji z zewnętrznego źródła wiedzy (np. bazy danych, dokumentów, wyszukiwarek).
- Generation – generowanie odpowiedzi przez model językowy (LLM), z wykorzystaniem wyszukanych informacji.
Cel: Umożliwić modelowi odpowiadanie na pytania w oparciu o aktualne i dokładne dane, które nie znajdują się bezpośrednio w jego wytrenowanej wiedzy.
Ogólny przepływ
- Input użytkownika (np. pytanie).
- Moduł Retrieval przeszukuje bazę wiedzy (np. dokumenty PDF, artykuły, wewnętrzne dane firmy).
- Zwrócone fragmenty są przekazywane jako kontekst do modelu językowego.
- Model generuje odpowiedź na podstawie pytania i dostarczonych fragmentów.