AI v2(~6 13) 업데이트 계획 - 100-hours-a-week/3-team-ssammu-wiki GitHub Wiki

MVP (~5/14)

  • 기업 정보 요약(RAG) 기능 구현

v2 (~6/13)

  • 이력서 정보 추출

    • 현재 Mistral-7B 모델과 다른 모델(aya-expanse-8b 등)과 답변 품질 비교 후 선택

    • 백엔드와 통신 테스트 예정

      model accuracy latency throughput accuracy_norm throughput_norm latency_norm
      0 Aya 0.765 4.2798 0.2354 0.765 0.861010 0.864153
      1 EXAONE 0.786 4.2558 0.2364 0.786 0.864667 0.869026
      2 HyperCLOVA 0.679 3.6984 0.2734 0.679 1.000000 1.000000
      3 Mistral 0.716 5.2308 0.1942 0.716 0.710315 0.707043
  • 이력서 초안 생성

    • 기본 이력서 생성 후 백엔드 통신 테스트 완료

v3 (~7/13)

  • 이력서 초안 생성
    • 고급 이력서 생성 : LangGraph 코드 구현 후 streamlit으로 테스트 중
  • 면접 피드백 기능
    • 추론 속도 최적화
  • 기업 추천 기능
    • 기능 구현
    • Embedding, 유사도 검색 성능 최적화
  • safety filter 적용

(6.5 기준)

  • 모델 선택 : 4가지 LLM 모델 성능 비교 후 선택 (ellina)
  • 면접 피드백 기능 (dain)
    • 파인튜닝 (LoRA Adapter 생성 후 다른 기능에서 활용시 과적합 문제 없는지 테스트)

  • expanse-8b 모델 추론 속도 최적화 (양자화 후 성능 테스트, I/O Cache 적용 검토)

Langgraph - streamlit 테스트 -> fastapi(백엔드 통신) 테스트

human in the loop : interrupt -> 사용자 입력 받고 -> resume

참고: Rest client extension 설치 후 test.http 파일에 여러 개 요청 넣어서 테스트 가능