πŸ“Š KULLM3 vs Qwen μ„±λŠ₯ 비ꡐ 뢄석 - 100-hours-a-week/20-real-wiki GitHub Wiki


1. ν•œκ΅­λ§ ν•  쀄 μ•Œμ•„?
πŸ’― 평가 λŠ₯λ ₯: ν•œκ΅­μ–΄λ‘œ λŒ€ν™”κ°€ κ°€λŠ₯ν•œμ§€ ν™•μΈν•˜κΈ° μœ„ν•œ κΈ°λ³Έ μ§ˆμ˜μž…λ‹ˆλ‹€.

2. λˆ„κ΅¬λƒ λ„ˆ
πŸ’― 평가 λŠ₯λ ₯: λͺ¨λΈμ˜ 자기 정체성, μ—­ν•  인식, μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈ 반영 μ—¬λΆ€ 등을 νŒλ‹¨ν•˜κΈ° μœ„ν•œ μ§ˆλ¬Έμž…λ‹ˆλ‹€.

3. β€˜κ³ κ΅¬λ§ˆβ€™λ‘œ μ‚Όν–‰μ‹œλ₯Ό μ§€μ–΄μ€˜
πŸ’― 평가 λŠ₯λ ₯: λͺ¨λΈμ˜ μ°½μ˜μ„±κ³Ό ν•œκ΅­μ–΄ 운율 기반 생성 λŠ₯λ ₯을 ν™•μΈν•˜κΈ° μœ„ν•œ 창의 ν‘œν˜„ μš”μ²­μž…λ‹ˆλ‹€.

4. λλ§μž‡κΈ°λ₯Ό ν•˜μž. λ‚΄κ°€ λ¨Όμ € ν• κ²Œ. 칼슘
πŸ’― 평가 λŠ₯λ ₯: ν•œκ΅­μ–΄ 단어 κ·œμΉ™ 이해, μ–Έμ–΄ 기반 κ²Œμž„ κ·œμΉ™ 적용 κ°€λŠ₯ μ—¬λΆ€ 확인을 μœ„ν•œ ν…ŒμŠ€νŠΈμž…λ‹ˆλ‹€.

5. μ² μˆ˜λŠ” ν•˜λ£¨μ— μΉ˜ν‚¨ 100마리λ₯Ό νŠ€κΈ°κ³  λ―Όμˆ˜λŠ” ν•˜λ£¨μ— μΉ˜ν‚¨ 60마리λ₯Ό νŠ€κΈ΄λ‹€. λˆ„κ°€ 더 일을 μž˜ν•˜μ§€?
πŸ’― 평가 λŠ₯λ ₯: 수치 기반 비ꡐ μ§ˆλ¬Έμ„ 톡해 λ‹¨μˆœ νŒλ‹¨λ ₯ λ˜λŠ” λΉ„νŒμ  사고 λŠ₯λ ₯을 ν‰κ°€ν•˜λŠ” ν•­λͺ©μž…λ‹ˆλ‹€.

6. λ‹€μŒ ν…μŠ€νŠΈλ₯Ό 곡식적인 μ–΄μ‘°λ‘œ λ°”κΏ”μ€˜.μ €λ²ˆ μ•„ν‹°ν΄μ—μ„œ μ €μ˜ νŒ€μ΄ κ°œλ°œν•œ ν”„λ‘œκ·Έλž¨μ„ μ†Œκ°œν•΄ λ“œλ Έμ–΄μš”. 이번 κΈ€μ—μ„œλŠ” ꡬ체적인 ν”„λ‘œκ·Έλž¨ μ‚¬μš©λ²•κ³Ό 저희 νŒ€μ—μ„œ ν™œμš©ν•œ 사둀λ₯Ό λ³΄μ—¬λ“œλ¦΄κ²Œμš”. μ €ν¬λŠ” λ‹€μ–‘ν•œ μ½˜ν…μΈ λ₯Ό μ œμž‘ν•˜κ³  μžˆμ–΄μš”. μ–΄λ ΅κ³  λ³΅μž‘ν•œ λ‚΄μš©λ“€μ΄ λ§Žμ•„μ„œ 주제λ₯Ό ν‘œν˜„ν•  수 μžˆλŠ” 상징적인 μ†Œμž¬λ‘œ 일러슀트λ₯Ό 많이 λ§Œλ“€μ–΄μš”. 예λ₯Ό λ“€μ–΄ 'μƒμŠΉν•˜λŠ” 코인 가격'을 μ΄μ•ΌκΈ°ν•˜λŠ” μ½˜ν…μΈ λΌλ©΄, '코인이 곡쀑에 λ– λ‹€λ‹ˆλŠ” λͺ¨μŠ΅'으둜 주제λ₯Ό ν•œ μž₯에 ν‘œν˜„ν•  수 μžˆμ„ 것 κ°™μ•„μš”.

πŸ’― 평가 λŠ₯λ ₯ : 비격식 λ¬Έμž₯을 κ²©μ‹μ²΄λ‘œ λ³€ν™˜ν•  수 μžˆλŠ”μ§€, λ§₯락과 톀 쑰절 λŠ₯λ ₯을 ν‰κ°€ν•˜κΈ° μœ„ν•œ λ¬Έμž₯ μŠ€νƒ€μΌ λ³€ν™˜ μš”μ²­μž…λ‹ˆλ‹€.


πŸ’‘ 1. GPU μΆ”λ‘  μ‹œκ°„ 비ꡐ (λ‹¨μœ„: 초)

image

번호 질문 μš”μ•½ KULLM3 Qwen2.5-14B Qwen2.5-7B
1 ν•œκ΅­λ§ ν•  쀄 μ•Œμ•„? 4.19 12.61 0.72
2 λˆ„κ΅¬λƒ λ„ˆ 2.38 2.94 1.52
3 '고ꡬ마'둜 μ‚Όν–‰μ‹œ μ§€μ–΄μ€˜ 3.90 2.35 3.24
4 λλ§μž‡κΈ° ν•˜μž. λ‚΄κ°€ λ¨Όμ € ν• κ²Œ: 칼슘 7.72 5.52 1.53
5 μΉ˜ν‚¨ 100마리 νŠ€κΈ°λŠ” 철수 vs 60마리 νŠ€κΈ°λŠ” 민수, λˆ„κ°€ 더 μž˜ν•΄? 8.80 13.15 11.16
6 ν”„λ‘œκ·Έλž¨ μ†Œκ°œκΈ€μ„ 곡식적인 μ–΄μ‘°λ‘œ λ°”κΏ”μ€˜ 20.16 12.61 4.04


πŸ’‘ 2. GPU λ©”λͺ¨λ¦¬ μ‚¬μš©λŸ‰ 비ꡐ (λ‹¨μœ„: GB)

image

번호 질문 μš”μ•½ KULLM3 Qwen2.5-14B Qwen2.5-7B
1 ν•œκ΅­λ§ ν•  쀄 μ•Œμ•„? 20.00 GB 27.53 GB 14.19 GB
2 λˆ„κ΅¬λƒ λ„ˆ 20.00 GB 27.54 GB 14.19 GB
3 '고ꡬ마'둜 μ‚Όν–‰μ‹œ μ§€μ–΄μ€˜ 20.00 GB 27.53 GB 14.19 GB
4 λλ§μž‡κΈ° ν•˜μž. λ‚΄κ°€ λ¨Όμ € ν• κ²Œ: 칼슘 20.00 GB 27.55 GB 14.19 GB
5 μΉ˜ν‚¨ 100마리 νŠ€κΈ°λŠ” 철수 vs 60마리 νŠ€κΈ°λŠ” 민수 20.18 GB 27.57 GB 14.19 GB
6 ν”„λ‘œκ·Έλž¨ μ†Œκ°œκΈ€μ„ 곡식적인 μ–΄μ‘°λ‘œ λ°”κΏ”μ€˜ 20.18 GB 27.58 GB 14.19 GB


πŸ’‘ 3. KULLM3 vs Qwen 응닡 비ꡐ

질문 6: μ² μˆ˜κ°€ ν•˜λ£¨μ— μΉ˜ν‚¨ 100마리λ₯Ό νŠ€κΈ°κ³ , λ―Όμˆ˜κ°€ 60마리λ₯Ό νŠ€κΈ΄λ‹€λ©΄ λˆ„κ°€ 더 일을 μž˜ν•˜λŠ”κ°€?

🟦 KULLM3의 응닡

μ² μˆ˜κ°€ ν•˜λ£¨μ— μΉ˜ν‚¨ 100마리λ₯Ό νŠ€κΈ°κ³  λ―Όμˆ˜κ°€ ν•˜λ£¨μ— μΉ˜ν‚¨ 60마리λ₯Ό νŠ€κΈ΄λ‹€λ©΄, μ² μˆ˜κ°€ 더 λ§Žμ€ μ–‘μ˜ μΉ˜ν‚¨μ„ νŠ€κ²¨μ„œ 더 λ§Žμ€ 일을 μž˜ν•˜κ³  μžˆλ‹€κ³  λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€. λ”°λΌμ„œ μ² μˆ˜κ°€ 더 일을 μž˜ν•œλ‹€κ³  ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

🟩 Qwen2.5-14B-Instruct의 응닡

μ² μˆ˜μ™€ λ―Όμˆ˜κ°€ 각각 ν•˜λ£¨μ— νŠ€κΈ°λŠ” μΉ˜ν‚¨μ˜ 수만으둜 일을 μž˜ν•˜λŠ”μ§€ νŒλ‹¨ν•˜κΈ°λŠ” μ–΄λ ΅μŠ΅λ‹ˆλ‹€. 일을 μž˜ν•˜λŠ”μ§€ ν‰κ°€ν•˜κΈ° μœ„ν•΄μ„œλŠ” λ‹€μŒ μš”μ†Œλ“€μ„ κ³ λ €ν•΄μ•Ό ν•©λ‹ˆλ‹€:

  1. ν’ˆμ§ˆ: μΉ˜ν‚¨μ˜ λ§›κ³Ό 질
  2. νš¨μœ¨μ„±: μžμ› 및 μ‹œκ°„ μ‚¬μš©
  3. 생산성: μž‘μ—…λŸ‰κ³Ό μΆ”κ°€ μ±…μž„
  4. μ•ˆμ „μ„±: μž‘μ—… 쀑 μ•ˆμ „ μ—¬λΆ€

λ‹¨μˆœν•œ 수치둜 νŒλ‹¨ν•  수 μ—†μœΌλ©°, λ‹€μ–‘ν•œ μš”μ†Œλ₯Ό μ’…ν•©μ μœΌλ‘œ κ³ λ €ν•΄μ•Ό ν•œλ‹€λŠ” κ²°λ‘ .

🟨 Qwen2.5-7B-Instruct (GPU)의 응닡

μ² μˆ˜μ™€ λ―Όμˆ˜κ°€ λͺ¨λ‘ λ›°μ–΄λ‚œ νŠ€κΉ€ κΈ°μˆ μ„ κ°€μ‘Œλ‹€κ³  κ°€μ •ν•˜λ©΄, λˆ„κ°€ 더 νš¨κ³Όμ μΈμ§€λŠ” λ‹€μŒκ³Ό 같은 μš”μ†Œμ— 따라 λ‹¬λΌμ§‘λ‹ˆλ‹€:

  1. 생산성: μ² μˆ˜κ°€ 더 많이 νŠ€κΉ€. κ·ΈλŸ¬λ‚˜ κΈ°κ³„λ‚˜ 곡간 μ œμ•½ κ³ λ € ν•„μš”
  2. 질과 μ„œλΉ„μŠ€: λ―Όμˆ˜λŠ” ν’ˆμ§ˆ 및 고객 λ§Œμ‘±μ— 더 적합할 수 있음
  3. κ²½ν—˜κ³Ό λŠ₯λ ₯: 숫자뿐 μ•„λ‹ˆλΌ 기술과 κ²½ν—˜μ˜ 쑰합이 μ€‘μš”
  4. νš¨μœ¨μ„±: μžμ› μ‚¬μš© μΈ‘λ©΄μ—μ„œ 철수의 λŒ€λŸ‰ 생산이 μž₯μ μ΄μ§€λ§Œ, 손싀 κ°€λŠ₯성도 있음

결둠적으둜, λ‹€μ–‘ν•œ μš”μ†Œλ₯Ό κ³ λ €ν•΄μ•Ό ν•˜λ©°, λ‹¨μˆœ μˆ˜μΉ˜λ‘œλŠ” νŒλ‹¨ λΆˆκ°€

🧠 μΈμ‚¬μ΄νŠΈ μš”μ•½

  • KULLM3: λΉ λ₯΄μ§€λ§Œ λ‹¨νŽΈμ μΈ νŒλ‹¨, μ •λŸ‰ λΉ„κ΅μ—λŠ” 강함, λ§₯락 해석은 ν•œκ³„
  • Qwen2.5-14B-Instruct: κ³ μ„±λŠ₯μ΄μ§€λ§Œ 무거움, κ°€μž₯ 논리적인 응닡 제곡
  • Qwen2.5-7B-Instruct: 응닡 ν’ˆμ§ˆκ³Ό 속도, μžμ› νš¨μœ¨μ„±μ˜ κ· ν˜•μ΄ κ°€μž₯ 뛰어남. μ‹€μ‚¬μš©μ— μ ν•©ν•œ λͺ¨λΈλ‘œ νŒλ‹¨λ¨

βœ… μ΅œμ’… μ„ μ • λͺ¨λΈ: Qwen2.5-7B-Instruct

μ €ν¬λŠ” μ—¬λŸ¬ LLM 후보 λͺ¨λΈ(KULLM3, Qwen2.5-14B, Qwen2.5-7B)을 비ꡐ μ‹€ν—˜ν•œ 끝에, μ΅œμ’…μ μœΌλ‘œ Qwen2.5-7B-Instructλ₯Ό μ„ νƒν•˜κ²Œ λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

이 λͺ¨λΈμ€ κ°€λ²Όμš΄ μ‚¬μ΄μ¦ˆμ™€ λΉ λ₯Έ 응닡 속도, 그리고 μš°μˆ˜ν•œ ν•œκ΅­μ–΄ λŒ€μ‘ λŠ₯λ ₯을 고루 κ°–μΆ˜ λͺ¨λΈλ‘œ, μ‹€μ‚¬μš© ν™˜κ²½μ— κ°€μž₯ μ ν•©ν•˜λ‹€κ³  νŒλ‹¨λ˜μ—ˆμŠ΅λ‹ˆλ‹€.


βœ… μ„ μ • 이유

  1. λΉ λ₯Έ 응닡 속도 (GPU κΈ°μ€€)

    • 동일 ν™˜κ²½μ—μ„œ μ‹€ν—˜ν•œ κ²°κ³Ό, μ„Έ λͺ¨λΈ 쀑 κ°€μž₯ λΉ λ₯Έ 응닡 속도λ₯Ό λ³΄μ˜€μŠ΅λ‹ˆλ‹€.
    • μ‹€μ‹œκ°„ 응닡이 μ€‘μš”ν•œ AI μ–΄μ‹œμŠ€ν„΄νŠΈ μ„œλΉ„μŠ€μ— 맀우 μ ν•©ν•©λ‹ˆλ‹€.
  2. κ°€λ²Όμš΄ ꡬ쑰 + μš°μˆ˜ν•œ ν’ˆμ§ˆ

    • 7B 크기의 λͺ¨λΈμ΄μ§€λ§Œ, 볡합적인 μ§ˆλ¬Έμ— λŒ€ν•œ 이해λ ₯κ³Ό 응닡 완성도 λͺ¨λ‘ μš°μˆ˜ν–ˆμŠ΅λ‹ˆλ‹€.
    • 특히 Qwen2.5-14B와 μœ μ‚¬ν•œ μˆ˜μ€€μ˜ λ¬Έμž₯ 완성도λ₯Ό 보이며, μ„œλΉ„μŠ€ ν’ˆμ§ˆμ„ μΆ©λΆ„νžˆ λ§Œμ‘±μ‹œν‚¬ 수 μžˆμ—ˆμŠ΅λ‹ˆλ‹€.
  3. 운영 ν™˜κ²½μ— μ ν•©ν•œ 쑰건 μΆ©μ‘±

    • GPU λ©”λͺ¨λ¦¬ μ•½ 14.19GB μˆ˜μ€€μœΌλ‘œ ν΄λΌμš°λ“œ 운영 λΉ„μš© μΈ‘λ©΄μ—μ„œλ„ 뢀담이 μ μŠ΅λ‹ˆλ‹€.
    • ν•œκ΅­μ–΄ 포함 멀티링ꡬ얼 지원, LoRA 기반 μ»€μŠ€ν„°λ§ˆμ΄μ§• κ°€λŠ₯, 128K μ»¨ν…μŠ€νŠΈ 길이 지원 λ“±
      μ‹€ μ„œλΉ„μŠ€ μ μš©μ„ μœ„ν•œ 쑰건을 λͺ¨λ‘ μΆ©μ‘±ν–ˆμŠ΅λ‹ˆλ‹€.
⚠️ **GitHub.com Fallback** ⚠️