Regression - BD-SEARCH/MLtutorial GitHub Wiki

νšŒκ·€λΆ„μ„(Regression)

  • λ³€μˆ˜μ™€ λ³€μˆ˜ κ°„μ˜ 관계λ₯Ό μœ μΆ”ν•˜λŠ” 방법
  • 데이터가 μ‘΄μž¬ν•  λ•Œ, κ·Έ 데이터에 μ ν•©ν•œ ν•¨μˆ˜λ₯Ό μΆ”μ •ν•˜λŠ” 방법.

νšŒκ·€λΆ„μ„μ˜ λΆ„λ₯˜

  • μ„ ν˜• νšŒκ·€λΆ„μ„ (Linear Regression): μ„ ν˜•ν•¨μˆ˜λ₯Ό μΆ”μ •ν•˜λŠ” νšŒκ·€λΆ„μ„. 'νšŒκ·€λΆ„μ„'이 μ„ ν˜• νšŒκ·€λΆ„μ„λ§Œμ„ λ‚˜νƒ€λ‚΄κΈ°λ„ ν•œλ‹€.
  • λ‘œμ§€μŠ€ν‹± νšŒκ·€λΆ„μ„ (Logistic Regression): 이항 λΆ„λ₯˜ 문제(True, False둜 λΆ„λ₯˜ν•˜λŠ” 문제)λ₯Ό ν•΄κ²°ν•˜λŠ” νšŒκ·€λΆ„μ„
  • 이외 λ‹€ν•­ν•¨μˆ˜ λ“± λ‹€μ–‘ν•œ ν•¨μˆ˜λ‘œ μΆ”μ •ν•˜λŠ” νšŒκ·€λΆ„μ„μ΄ μžˆλ‹€.

νšŒκ·€λΆ„μ„μ„ μ‚¬μš©ν•˜λŠ” μ „ν˜•μ μΈ 예

  • 과거의 데이터λ₯Ό μ΄μš©ν•΄ 미래 예츑. μ§€λ‚œ 10λ…„κ°„ 음료 νŒλ§€λŸ‰ 데이터가 μžˆμ„ λ•Œ νšŒκ·€λΆ„μ„μœΌλ‘œ 미래의 음료 νŒλ§€λŸ‰μ„ μΆ”μ •ν•  수 μžˆλ‹€.
  • 비연속적 데이터λ₯Ό μ΄μš©ν•΄ 연속적인 κ°’ 예츑. 맀년 1μ›” 1μΌλ§ˆλ‹€ κ΅­κ°€μ˜ 총 인ꡬ수λ₯Ό μ‘°μ‚¬ν•œ 데이터가 μžˆμ„ λ•Œ νšŒκ·€λΆ„μ„μœΌλ‘œ 맀년 7μ›” 1일 λ“±μ˜ 데이터λ₯Ό μΆ”μ •ν•  수 μžˆλ‹€.

κ·ΈλŸ¬λ‚˜ λ”₯λŸ¬λ‹μ—μ„œ νšŒκ·€λΆ„μ„μ„ μ΄μš©ν•˜λ©΄ 더 λ‹€μ–‘ν•œ 것듀을 ν•  μˆ˜λ„ μžˆλ‹€. μ•„λž˜ μ˜ˆμ œλŠ” 넓은 λ²”μœ„μ—μ„œ νšŒκ·€λΆ„μ„μ— μ†ν•˜λŠ” μ˜ˆμ‹œμ΄λ‹€.

  • 흑백 이미지에 색 μž…νžˆκΈ°(λ…Όλ¬Έ: Deep Colorization): μž…λ ₯이 흑백 이미지이고 좜λ ₯이 컬러 이미지인 ν•¨μˆ˜λ₯Ό Regression 기반 model둜 κ΅¬ν˜„ν•˜μ˜€λ‹€κ³  λ³Ό 수 μžˆλ‹€.
  • κΈ€μ˜ 감정 λΆ„μ„ν•˜κΈ°: μž…λ ₯이 ν…μŠ€νŠΈμ΄κ³  좜λ ₯이 감정(행볡 λ“±λ“±)을 가진 정도인 ν•¨μˆ˜λ₯Ό νšŒκ·€λΆ„μ„μœΌλ‘œ κ΅¬ν•΄λ‚΄λŠ” Model둜 λ³Ό 수 μžˆμ„ 것이닀.

이와 같이, μž…λ ₯κ³Ό 좜λ ₯이 μžˆμœΌλ©΄μ„œ 좜λ ₯이 연속적인 값인 ν•¨μˆ˜λŠ” λͺ¨λ‘ 넓은 λ²”μœ„μ˜ νšŒκ·€λΆ„μ„μœΌλ‘œ λ³Ό 수 μžˆλ‹€.

참고 자료)

(1) λ‘œμ§€μŠ€ν‹± νšŒκ·€ (Logistic Regression)

λ‘œμ§€μŠ€ν‹± νšŒκ·€λŠ” 이항뢄λ₯˜ λ¬Έμ œμ— μ‚¬μš©λ˜λŠ” νšŒκ·€λ‘œ, νŠΉμ • λΆ„λ₯˜μ— μ†ν•œλ‹€/μ•ˆ μ†ν•œλ‹€λ₯Ό νŒλ³„ν•  λ•Œ μ‚¬μš©ν•œλ‹€. Sigmoid ν•¨μˆ˜ 등을 μ΄μš©ν•  수 μžˆλ‹€.

(2) μ„ ν˜• νšŒκ·€λΆ„μ„

  • 쒅속 λ³€μˆ˜ y와 ν•œ 개 μ΄μƒμ˜ 독립 λ³€μˆ˜ Xμ™€μ˜ μ„ ν˜• 상관 관계λ₯Ό λͺ¨λΈλ§ν•˜λŠ” νšŒκ·€λΆ„μ„
  • λ°μ΄ν„°μ˜ νŒ¨ν„΄μ„ λΉ„μŠ·ν•˜κ²Œ λͺ¨μ‚¬ν•˜λŠ” μ„ ν˜• ν•¨μˆ˜λ₯Ό μ°ΎλŠ” 방법.
  • μ‹€μ œ κ°’κ³Ό κ΅¬ν•œ μ„ ν˜• ν•¨μˆ˜ 간에 μ˜€μ°¨κ°€ λ°œμƒν•œλ‹€.
  • Linear Least Squares: 였차 제곱의 합이 μ΅œμ†Œν™”λ˜λŠ” μ„ ν˜• ν•¨μˆ˜λ₯Ό μ°ΎλŠ” 방법
    • 였차 제곱의 합을 μ“°λŠ” 이유: ν•¨μˆ˜μ™€ μ λ“€μ˜ 거리의 합이 μ΅œμ†Œκ°€ λ˜λŠ” 것이 λͺ©ν‘œμ΄κΈ° λ•Œλ¬Έμ—.

Reference)