RAG 설계 타당성 종합 평가 - 100-hours-a-week/6-nemo-wiki GitHub Wiki

네모 서비스 – RAG (Retrieval Augmented Generation) 설계 문서 (이해하기 쉬운 버전)

네모 서비스는 사용자가 새로운 모임을 찾거나 일정을 추천받을 때,
단순한 키워드 검색이나 기존 카테고리 분류 방식으로는 만족스러운 결과를 제공하는 데 한계가 있었습니다.

특히 사용자가 작성한 자연어 요청(예: "초보자를 위한 생성형 AI 모임 추천")을 정확하게 이해하고,
알맞은 모임을 추천하려면 단순한 생성 모델만으로는 부족했습니다.

→ 이 문제를 해결하기 위해,
→ 기존 데이터(모임 소개, 태그, 목적 등)를 활용하는 검색 기반 문맥 강화,
즉 RAG 구조를 도입했습니다.

아래는 RAG 구조의 전체 흐름입니다:

graph TD
A[사용자 질의] --> B[질의 임베딩 생성]
B --> C[ChromaDB에서 유사 모임 검색]
C --> D[검색된 모임 데이터 수집]
D --> E[FastAPI 서버 호출]
E --> F[LLM에 검색 문맥 삽입 후 응답 생성]

즉:
사용자가 입력한 문장을 이해하고 →
비슷한 모임을 찾아내어 →
그 정보까지 모델에 넘긴 후 →
훨씬 정확하고 자연스러운 답변을 만들게 됩니다.

한마디로, "사용자 요청" → "의미 검색" → "모델 입력" → "더 똑똑한 답변" 이라는 흐름을 단계별로 설계했습니다.

RAG을 적용하기 전후의 차이를 표로 정리하면 다음과 같습니다:

정량적 검증 방법:

→ **단순 정확도뿐 아니라, 사용자의 실제 행동 변화(참여율)**을 지표로 삼아 평가할 계획입니다.

RAG 구조를 지금보다 더 발전시키기 위한 계획입니다:

평가 항목	설명
정확성 향상	사용자의 의미를 이해하고 그에 맞는 결과 제공 가능
확장성	다양한 도메인(모임, 일정, 후기 등)으로 손쉽게 확장 가능
비용 효율성	자체 ChromaDB 운영으로 외부 API 비용 없이 유지
운영 효율성	FastAPI 모듈화를 통한 서버 유지관리 편리성 확보

네모 서비스는 RAG 구조를 통해
단순 추천 시스템을 넘어 사용자 맞춤형, 자연어 이해 기반 추천 서비스로 진화하고 있습니다.

네모 서비스에 적용된 RAG 설계는,
자연어 이해, 의미 기반 검색, 개인화 추천을 자연스럽게 통합함으로써
사용자 경험(UX)을 한층 끌어올릴 준비를 완료했습니다.
앞으로 데이터 확장 및 모델 최적화를 통해 더욱 강력한 추천 시스템으로 발전할 수 있습니다.