📘 LangChain Structured Agent 기반 장소 추천 체인 설계

✅ Why: 왜 구조화된 멀티스텝 Agent 체인이 필요한가?

본 서비스는 사용자 입력을 기반으로 장소를 추천하는 시스템으로,
정확한 추천을 위해 여러 단계의 추론과 외부 리소스 활용이 필요함.
또한, 최종 추천 결과는 다음과 같은 정해진 JSON 스키마로 반환되어야 함:

{
  "data": [
    {"place_id": 21, "similarity_score": 0.92},
    ...
  ]
}

이를 위해 LangChain의 AgentType.STRUCTURED_CHAT_ZERO_SHOT을 기반으로 각 추론 단계를 구조화된 Tool로 분리하고, Agent가 이 Tool들을 자동으로 실행하도록 구성함.

🛠️ 체인 구성 흐름도

flowchart TD
    A[사용자 입력] --> B[Tool 1: 키워드 추출]
    B --> C[Tool 2: 유사 키워드 검색]
    C --> D[Tool 3: 가중 평균 임베딩 생성]
    D --> E[Tool 4: 장소 벡터 DB 검색]
    E --> F[구조화된 추천 결과 반환]

🔧 각 Tool 정의

🔹 Tool 1: `extract_keywords`

기능: LLM 사용자 자연어 입력에서 장소 추천에 필요한 키워드 및 이용 시간 추출
입력 스키마:

{
  "user_input": "내일 저녁에 분위기 좋은 데이트 장소 추천해줘"
}

출력 스키마:

{
  "keywords": ["데이트", "감성", "야경"]
}

🔹 Tool 2: `search_similar_keywords`

기능: 추출된 키워드를 벡터화하여 벡터 DB에서 유사 키워드를 검색
입력 스키마:

{
  "keywords": ["데이트", "감성", "야경"]
}

출력 스키마:

{
  "similar_keywords": [
    {"keyword": "로맨틱", "score": 0.87},
    {"keyword": "분위기", "score": 0.85}
  ]
}

🔹 Tool 3: `compute_user_embedding`

기능: 유사 키워드의 유사도를 가중치로 사용해 평균 임베딩 벡터 생성
입력 스키마:

{
  "similar_keywords": [
    {"keyword": "로맨틱", "score": 0.87},
    {"keyword": "분위기", "score": 0.85}
  ]
}

출력 스키마:

{
  "vector": [0.125, -0.098, 0.234, ...]
}

🔹 Tool 4: `recommend_places`

기능: 사용자 벡터와 이용 시간을 기준으로 장소 벡터 DB에서 유사 장소 추천
입력 스키마:

{
  "vector": [...]
}

출력 스키마 (최종 응답):

{
  "data": [
    {"place_id": 21, "similarity_score": 0.92},
    {"place_id": 36, "similarity_score": 0.86},
    ...
  ]
}

🧩 기술 스택 요약

항목	기술	설명
LLM	Gemini (via GoogleGenerativeAI)	사용자 입력 이해 및 키워드 추출
Embedding	KR-SBERT	키워드 및 장소 벡터화
Vector DB	Chroma	유사 키워드 및 장소 검색
LangChain 구성	Agent + StructuredTool + Pydantic	Tool 기반 체인 자동 실행

✅ Agent 구성 방식

AgentType.STRUCTURED_CHAT_ZERO_SHOT 사용
각 Tool은 StructuredTool.from_function(...)으로 등록
LLM은 자연어 입력을 바탕으로 Tool을 순차적으로 호출
각 Tool의 입력/출력은 명시적으로 정의된 JSON 스키마를 따름

🚀 기대 효과

항목	효과
🎯 응답 정확도	중간 단계별 추론으로 장소 추천의 정밀도 향상
📦 API 호환성	구조화된 응답 스키마로 백엔드와의 통합이 용이
🛠 유지보수성	각 Tool이 모듈화되어 디버깅, 교체, 테스트가 쉬움
🔄 확장 가능성	새로운 Tool 추가만으로 기능 확장 (예: 사용자 위치 필터)

🧭 향후 확장 계획

위치 기반 필터 Tool 추가
조건별 추천 이유 생성 Tool (LLM 기반)
Tool 호출 결과 캐싱 또는 로그 저장 기능 추가

📝 참고: 일부 구현 예시 코드

구성 예정 파일 구조 예시

/place_recommendation_chain
├── schemas.py            # Pydantic 기반 요청/응답 정의
├── tools.py              # 모든 Tool 함수 정의
├── agent.py              # Agent + Tool 조합 + 실행 함수
└── run.py                # 테스트용 엔트리포인트 (user_input -> final JSON 응답)

schemas.py

# schemas.py

from pydantic import BaseModel, Field
from typing import List, Literal


# ✅ Tool 1: 사용자 입력 → 키워드 추출

class ExtractKeywordsInput(BaseModel):
    user_input: str

class ExtractKeywordsOutput(BaseModel):
    keywords: List[str]


# ✅ Tool 2: 키워드 → 유사 키워드 검색

class SearchSimilarKeywordsInput(BaseModel):
    keywords: List[str]

class SimilarKeyword(BaseModel):
    keyword: str
    score: float

class SearchSimilarKeywordsOutput(BaseModel):
    similar_keywords: List[SimilarKeyword]


# ✅ Tool 3: 유사 키워드 → 가중 평균 벡터 생성

class ComputeUserEmbeddingInput(BaseModel):
    similar_keywords: List[SimilarKeyword]

class ComputeUserEmbeddingOutput(BaseModel):
    vector: List[float]


# ✅ Tool 4: 사용자 벡터 → 장소 추천

class RecommendPlacesInput(BaseModel):
    vector: List[float]

class RecommendedPlace(BaseModel):
    place_id: int
    similarity_score: float

class RecommendPlacesOutput(BaseModel):
    data: List[RecommendedPlace]

tools.py

# tools.py

from langchain.tools import StructuredTool
from schemas import (
    ExtractKeywordsInput, ExtractKeywordsOutput,
    SearchSimilarKeywordsInput, SearchSimilarKeywordsOutput,
    ComputeUserEmbeddingInput, ComputeUserEmbeddingOutput,
    RecommendPlacesInput, RecommendPlacesOutput
)
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.llms import GoogleGenerativeAI
import json
import faiss
import numpy as np
import pickle

# 🔧 공통 임베딩 모델
embedding_model = HuggingFaceEmbeddings(model_name="snunlp/KR-SBERT-V40K-klueNLI-augSTS")

# 🔧 Gemini LLM (예시)
llm = GoogleGenerativeAI(
    model="models/gemini-2.0-flash-lite",
    google_api_key="YOUR_GEMINI_API_KEY"
)


# ✅ Tool 1: 키워드 추출
def extract_keywords_fn(input: ExtractKeywordsInput) -> ExtractKeywordsOutput:
    prompt = f"""
    다음 사용자 입력에서 장소 추천을 위한 키워드를 JSON 형식으로 추출하세요.

    입력: "{input.user_input}"

    출력 예시:
    {{
        "keywords": ["데이트", "감성", "야경"]
    }}
    """
    response = llm(prompt)
    parsed = json.loads(response)
    return ExtractKeywordsOutput(**parsed)


# ✅ Tool 2: 유사 키워드 검색
def search_similar_keywords_fn(input: SearchSimilarKeywordsInput) -> SearchSimilarKeywordsOutput:
    index = faiss.read_index("keyword_vectors.index")
    with open("keyword_meta.pkl", "rb") as f:
        keyword_meta = pickle.load(f)

    vectors = embedding_model.embed_documents(input.keywords)
    query = np.mean(vectors, axis=0).astype("float32").reshape(1, -1)

    D, I = index.search(query, 5)
    similar = [{"keyword": keyword_meta[i], "score": float(D[0][j])} for j, i in enumerate(I[0])]
    return SearchSimilarKeywordsOutput(similar_keywords=similar)


# ✅ Tool 3: 가중 평균 벡터 생성
def compute_user_embedding_fn(input: ComputeUserEmbeddingInput) -> ComputeUserEmbeddingOutput:
    vectors = [embedding_model.embed_query(kw.keyword) for kw in input.similar_keywords]
    sims = [kw.score for kw in input.similar_keywords]

    weighted = sum(np.array(vec) * sim for vec, sim in zip(vectors, sims))
    avg_vector = weighted / sum(sims)

    return ComputeUserEmbeddingOutput(vector=avg_vector.tolist())


# ✅ Tool 4: 장소 추천
def recommend_places_fn(input: RecommendPlacesInput) -> RecommendPlacesOutput:
    index = faiss.read_index("place_vectors.index")
    with open("place_meta.pkl", "rb") as f:
        place_meta = pickle.load(f)

    vec = np.array(input.vector).astype("float32").reshape(1, -1)
    D, I = index.search(vec, 5)

    recommended = [
        {"place_id": int(place_meta[i]["id"]), "similarity_score": float(D[0][j])}
        for j, i in enumerate(I[0])
    ]

    return RecommendPlacesOutput(data=recommended)

agent.py

# agent.py

from langchain.agents import AgentExecutor, Tool, initialize_agent
from langchain.agents.agent_types import AgentType
from langchain_community.llms import GoogleGenerativeAI
from langchain.tools import StructuredTool

from tools import (
    extract_keywords_fn,
    search_similar_keywords_fn,
    compute_user_embedding_fn,
    recommend_places_fn
)
from schemas import (
    ExtractKeywordsInput, ExtractKeywordsOutput,
    SearchSimilarKeywordsInput, SearchSimilarKeywordsOutput,
    ComputeUserEmbeddingInput, ComputeUserEmbeddingOutput,
    RecommendPlacesInput, RecommendPlacesOutput
)

# ✅ LLM (Gemini)
llm = GoogleGenerativeAI(
    model="models/gemini-pro",
    google_api_key="YOUR_GEMINI_API_KEY"
)

# ✅ Tool 목록 (구조화된 입력/출력 스키마 적용)
tools = [
    StructuredTool.from_function(
        name="extract_keywords",
        description="사용자 입력에서 장소 추천에 필요한 키워드를 추출합니다.",
        func=extract_keywords_fn,
        args_schema=ExtractKeywordsInput,
        return_schema=ExtractKeywordsOutput
    ),
    StructuredTool.from_function(
        name="search_similar_keywords",
        description="추천 키워드를 기반으로 벡터 DB에서 유사 키워드를 검색합니다.",
        func=search_similar_keywords_fn,
        args_schema=SearchSimilarKeywordsInput,
        return_schema=SearchSimilarKeywordsOutput
    ),
    StructuredTool.from_function(
        name="compute_user_embedding",
        description="유사 키워드와 유사도 점수를 기반으로 가중 평균 임베딩 벡터를 계산합니다.",
        func=compute_user_embedding_fn,
        args_schema=ComputeUserEmbeddingInput,
        return_schema=ComputeUserEmbeddingOutput
    ),
    StructuredTool.from_function(
        name="recommend_places",
        description="사용자 임베딩 벡터를 기반으로 장소 벡터 DB에서 추천 결과를 반환합니다.",
        func=recommend_places_fn,
        args_schema=RecommendPlacesInput,
        return_schema=RecommendPlacesOutput
    )
]

# ✅ Agent 생성
agent_executor = initialize_agent(
    tools=tools,
    llm=llm,
    agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT,
    verbose=True
)

run.py

# run.py

from agent import agent_executor

if __name__ == "__main__":
    # 📝 테스트용 사용자 입력
    user_query = "저녁에 분위기 좋은 데이트 장소 추천해줘"

    print("\n==============================")
    print("🔍 사용자 요청:", user_query)
    print("==============================\n")

    # 🧠 LangChain Agent 실행
    result = agent_executor.run(user_query)

    print("\n==============================")
    print("🏆 최종 추천 결과 (구조화된 JSON):")
    print(result)
    print("==============================")

🤖 4단계 : LangChain 기반 멀티스텝 AI 구현 검토 - 100-hours-a-week/7-team-ddb-wiki GitHub Wiki

📘 LangChain Structured Agent 기반 장소 추천 체인 설계

✅ Why: 왜 구조화된 멀티스텝 Agent 체인이 필요한가?

🛠️ 체인 구성 흐름도

🔧 각 Tool 정의

🔹 Tool 1: `extract_keywords`

🔹 Tool 2: `search_similar_keywords`

🔹 Tool 3: `compute_user_embedding`

🔹 Tool 4: `recommend_places`

🧩 기술 스택 요약

✅ Agent 구성 방식

🚀 기대 효과

🧭 향후 확장 계획

📝 참고: 일부 구현 예시 코드

구성 예정 파일 구조 예시

⚠️ GitHub.com Fallback ⚠️

🤖 4단계 : LangChain 기반 멀티스텝 AI 구현 검토 - 100-hours-a-week/7-team-ddb-wiki GitHub Wiki

📘 LangChain Structured Agent 기반 장소 추천 체인 설계

✅ Why: 왜 구조화된 멀티스텝 Agent 체인이 필요한가?

🛠️ 체인 구성 흐름도

🔧 각 Tool 정의

🔹 Tool 1: extract_keywords

🔹 Tool 2: search_similar_keywords

🔹 Tool 3: compute_user_embedding

🔹 Tool 4: recommend_places

🧩 기술 스택 요약

✅ Agent 구성 방식

🚀 기대 효과

🧭 향후 확장 계획

📝 참고: 일부 구현 예시 코드

구성 예정 파일 구조 예시

⚠️ **GitHub.com Fallback** ⚠️

🔹 Tool 1: `extract_keywords`

🔹 Tool 2: `search_similar_keywords`

🔹 Tool 3: `compute_user_embedding`

🔹 Tool 4: `recommend_places`

⚠️ GitHub.com Fallback ⚠️