챗봇 모델 최적화 - 100-hours-a-week/6-nemo-wiki GitHub Wiki

챗봇 로컬 모델 리스트

모델명 매개변수 장점 출시 용도 적합성
Gemma 7B (Google) 7B Google 최신 모델, 빠르고 가벼움, 채팅에 특화된 버전 존재 (Gemma-instruct) 2024.02 GPT-3.5 수준, 챗봇 대화 적합
Mistral 7B Instruct 7B 매우 빠름, 최신 구조, 다양한 응용 예시 있음 2023.10 정확도·속도 균형 좋음
LLaMA 3 8B 8B Meta 최신 모델, 성능은 GPT-3.5~4 수준 2024.04 가장 핫한 범용 챗봇용 모델
OpenChat 3.5 7B 대화 튜닝 잘 되어 있음, 친화적 응답 2024.03 챗봇 사용자 UX에 매우 적합
Phi-2 (MS) 1.3B 작고 빠름, 초경량 챗봇에 좋음 2023.12 성능은 낮지만 속도는 탁월
MythoMax-L2 13B 고성능, 논리/감성 균형 잘 맞음 2023.09 GPT-4급 자유응답형 챗봇 가능
Neural Chat 7B (Intel) 7B HuggingFace 지원, Intel에서 최적화 2023.08 x86 기반 CPU 대응 가능