2021 09 23 - KR-HappyFace/meetup-logs GitHub Wiki

๊ทธ๋ผ์šด๋“œ๋ฃฐ

  • ํ”ผ์–ด์„ธ์…˜ ์‹œ์ž‘ ์‹œ๊ฐ„: 4์‹œ ~ 5์‹œ ๋ฐ˜
  • ์—…์Šคํ…Œ์ด์ง€ ์—ฐ๊ฒฐ๋œ ์—๋””ํ„ฐ
    • Pycharm: ๊น€์ค€ํ™, ์ „์žฌ์˜, ๊น€ํ˜„์ˆ˜
    • VSCode: ์•ˆ์˜์ง„, ์ตœ์„ฑ์šฑ, ๊น€์—ฐ์ฃผ, ๋‚จ์„ธํ˜„
  • ์—๋””ํ„ฐ๊นŒ์ง€๋Š” ํ†ต์ผํ•˜๊ธฐ๋Š” ์–ด๋ ค์›Œ๋„, formatter์€ black์œผ๋กœ ํ†ต์ผํ•˜์ž!
  • ์—๋””ํ„ฐ ์„ค์ • ํ†ต์ผ ๋ฐฉ์‹์€ slack์— tip์— ์˜ฌ๋ผ์™€์žˆ๋Š” settings.json์„ ๋‹ค์šด๋กœ๋“œ ๋ฐ›์•„์„œ .vscode ํด๋” ๋ฐ‘์—๋‹ค๊ฐ€ ๋†“์œผ๋ฉด ๋!

๋Œ€ํšŒ ๋ง๊ณ  ์–ด๋–ค ๊ณต๋ถ€๋ฅผ ๋” ํ•˜๊ณ  ์‹ถ์œผ์‹ ์ง€?

  • ๋‹ค๋ฅธ ๊ณต๋ถ€๊นŒ์ง€๋Š” ์•„์ง ์ƒ๊ฐ ๋ชปํ•ด๋ณธ ๋“ฏ. ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฐ์ดํ„ฐ๋ฅผ ์จ๋ณด๊ณ  ์‹ถ๋‹ค.

๊ตญ๋ฆฝ๊ตญ์–ด์› Task ๋ฐ๋“œ๋ผ์ธ ๊ด€๋ จ

  • ๋ฌธ์žฅ ๋ฌธ๋ฒ•์„ฑ ํŒ๋‹จ, ๋™ํ˜•์ด์˜์–ด ๊ตฌ๋ณ„๊นŒ์ง€ ์ด๋ฒˆ์ฃผ ์ฃผ๋ง๊นŒ์ง€ ํ•ด๋ณด๋Š” ๊ฑธ๋กœ ํ•˜์ž. ๐Ÿ‘
  • ๊ณผ์ œ ์ˆ˜ํ–‰์€ ์ฒซ ์ œ์ถœ๊นŒ์ง€ ๊ฐ™์ด ์ง„ํ–‰ํ•˜๋Š” ๊ฑธ๋กœ, ๊ทธ ๋‹ค์Œ์— ๊ฐ ๊ณผ์ œ ๋ณ„๋กœ ๋ถ„์—…์„ ํ•ด๋„ ๊ดœ์ฐฎ๊ฒ ๋„ค์š”.
  • ๊ณผ์ œ 4๊ฐœ 1์ฐจ ์ œ์ถœ ๋ฐ๋“œ๋ผ์ธ์„ 10์›” 11์ผ๊นŒ์ง€
  • Dataset, Dataloader Class ๊ตฌ์„ฑ์€ ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ํ•˜๋Š”๊ฐ€? ์˜ˆ์ „์—๋Š” Glueon NLP์—์„œ ์ œ๊ณตํ•˜๋Š” ๊ฑธ๋กœ ํ•ด์„œ.
  • ๋‹ค์Œ์ฃผ์— KLUE ๋Œ€ํšŒ ๋ฒ ์ด์Šค๋ผ์ธ ๊ธฐ๋Œ€ํ•œ ๊ฒƒ๋„ Dataloader์„ ๊ธฐ๋Œ€ํ•œ ๊ฑฐ๋ผ์„œ. ์š”๊ฑด ์˜คํ›„์— ๋” ์–˜๊ธฐํ•˜๋Š” ๊ฑธ๋กœ!
    • CoLA(๋ฌธ๋ฒ•์„ฑํŒ๋‹จ: binary classification): ์ „์žฌ์˜, ๊น€์ค€ํ™, ๊น€์—ฐ์ฃผ, ๊น€ํ˜„์ˆ˜
      • EDA๋ฅผ ์ข€ ํ•ด๋ด์•ผ ํ•  ๊ฒƒ ๊ฐ™์•„์„œ.
    • WiC(๋™ํ˜•์ด์˜์–ด: embedding & cosine similarity & machine learning): ์•ˆ์˜์ง„, ์ตœ์„ฑ์šฑ, ๋‚จ์„ธํ˜„,
  • ์นด์นด์˜ค 2์ฐจ๊ฐ€ ํ† ์š”์ผ์— ์žˆ์–ด์„œ ํž˜๋“ค๋‹ค: ๊น€์—ฐ์ฃผ, ๊น€์ค€ํ™ -> ํŒŒ์ดํŒ…!

๋ฌธ์žฅ ๋ฌธ๋ฒ•์„ฑ ํŒ๋‹จ

๋™ํ˜•์ด์˜์–ด

  • Cosine similarity๋กœ ํ•  ๊ฒฝ์šฐ์—๋Š” ๋‹จ์–ด๋“ค์˜ ์œ ์‚ฌํ•œ ์ •๋„๋ฅผ cut-off line์œผ๋กœ ์–ด๋–ป๊ฒŒ ์ •ํ•˜๋Š”์ง€๋„ ์ค‘์š”ํ•œ ๋“ฏ.
  • Fine-tuning์„ ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ํ•œ๋‹ด? Train์ด ๋” ํ•„์š”๊ฐ€ ์—†๋‹ค๋Š” ์ƒ๊ฐ์ด ๋“ค์–ด์„œโ€ฆ
  • Train์ด๋ž‘ Dev๋ฅผ ํ•ฉ์นœ ๋‹ค์Œ์— K-fold๋ฅผ ์ง„ํ–‰ํ•ด๋„ ์ข‹์„ ๋“ฏ! ์›Œ๋‚™ ๋ฐ์ดํ„ฐ์ˆ˜๊ฐ€ ์ ๋‹ค ๋ณด๋‹ˆ๊นŒ.

ํ˜‘์—… ๋ฐฉ์‹ (์ฝ”๋“œ ์ˆ˜์ • ๋ฐ remote ์—…๋ฐ์ดํŠธ)

  • Github ์“ฐ๋Š” ๊ฑธ๋กœโ€ฆ Conflict๋‚˜๋„ ํ•˜๋Š” ๊ฒŒ ์ข‹์„ ๊ฒƒ ๊ฐ™๋‹ค.
  • ์‚ฌ์šฉํ•˜๋Š” Github GUI๋Š”?
    • ์ค€ํ™, ์žฌ์˜: Kraken
    • ์—ฐ์ฃผ, ์„ฑ์šฑ, ํ˜„์ˆ˜: Github Desktop
    • ์˜์ง„: Sourcetree -> Kraken
  • ๊ตฌ๊ธ€์บ˜๋ฆฐ๋” ์จ๋ด…์‹œ๋‹ค ใ…Žใ……ใ…Ž;;;; ๊ฐ€์šด๋ฐ ์ƒ‰์ด ์—†์ด ๋„ค๋ชจ๋ฐ•์Šค๋งŒ ๋˜์–ด ์žˆ๋Š” ์ผ์ •๋งŒ ์ž‡๊ณ  ๊ทธ๋ ‡์ง€ ์•Š์€ ์ผ์ •์ด ์žˆ๋Š”๋ฐ ๊ทธ๊ฒŒ ๋ฌด์Šจ ์ฐจ์ด์ผ๊นŒ์š” ใ…Žใ……ใ…Ž?
  • ์ฒ˜์Œ์—๋Š” jupyter-notebooks ์•ˆ์—์„œ ์ž‘์—…ํ•˜๋‹ค๊ฐ€, ๋งˆ๋ฌด๋ฆฌํ•  ๋•Œ ์ฆˆ์Œ์— ํŒŒ์ด์ฌ ํŒŒ์ผ๋กœ ์ชผ๊ฐœ๋†“๊ธฐ

Commit convention์„ ์ €ํฌ๋ผ๋ฆฌ ์ •ํ•˜๋Š” ๊ฒƒ์ด ์ข‹์„๊นŒ?

  • ์˜์–ด๋กœ ํ†ต์ผ

  • ๋™์‚ฌ๋ฅผ ์•ž์—๋‹ค๊ฐ€ ๋นผ๊ณ  colon์œผ๋กœ ํ•œ๋‹ค.

  • Branch๋ฅผ 3๊ฐœ๋ฅผ ๋”ด ๋‹ค์Œ์— ๋‹ค์‹œ ๋˜ ๊ฐœ์ธ๋ณ„๋กœ ํ•˜๋Š” ๊ฑด๊ฐ€์š”?

  • Main, dev, ๊ฐœ์ธ๋ธŒ๋žœ์น˜

๋ชจ๋”๋ ˆ์ดํ„ฐ ์—ญํ• 

  • ํšŒ์˜๋ก ์“ฐ๊ธฐ

  • ํ•œ ์ฃผ ํšŒ๊ณ  ์ œ์ถœํ•˜๊ธฐ

  • ๋ชจ๋”๋ ˆ์ดํ„ฐ๊ฐ€ MC ์—ญํ•  (์ฒ˜์Œ 15๋ถ„ ์ •๋„๋Š” ๊ทธ๋ ‡๊ฒŒ ํ•˜๊ธฐ)

  • ํ”ผ์–ด์„ธ์…˜ log๋Š” github wiki์—๋‹ค๊ฐ€ ์ •๋ฆฌํ•˜๊ธฐ.

  • Todo List ์ •ํ•˜๊ธฐ!

  • 1์ฃผ์ฐจ: ์•ˆ์˜์ง„

  • 2์ฃผ์ฐจ: ๊น€์ค€ํ™

  • 3์ฃผ์ฐจ: ์ „์žฌ์˜

  • 4์ฃผ์ฐจ: ๊น€ํ˜„์ˆ˜

  • 5์ฃผ์ฐจ: ์ตœ์„ฑ์šฑ

  • 6์ฃผ์ฐจ: ๊น€์—ฐ์ฃผ

  • 7์ฃผ์ฐจ: ๋‚จ์„ธํ˜„

ํ”ผ์–ด๊ทœ์น™

  • ~๋‹˜์ด๋ผ๊ณ  ๋ถ€๋ฅด๊ธฐ
  • 5๋ถ„ ์ง€๊ฐํ•˜๋ฉด ๋…ผ๋ฌธ ํ•˜๋‚˜ ๋ฆฌ๋ทฐํ•ด์˜ค๊ธฐ :) (5๋ถ„ ๋‹น ํ•˜๋‚˜)
  • ์กฐ๊ธฐ ๋ถˆ์ฐธ์€ ๋ฏธ๋ฆฌ ์–˜๊ธฐํ•˜๊ธฐ

๋ฉ˜ํ† ๋‹˜์ด๋ž‘ ์–ด๋–ค ๊ฑฐ ํ•˜๋ฉด ์ข‹๊ฒ ์–ด์š”?

  • ์ง€๊ธˆ๊นŒ์ง€ ๋ฉ˜ํ† ๋‹˜์ด๋ž‘ ํ•œ ๊ฒŒ ์—†์–ด์„œ(โ€ฆ ์Šฌํ”ˆ ์ด์•ผ๊ธฐ)
  • ๋ฐฉ๊ธˆ ๋ฉ˜ํ† ๋‹˜์€ ๋ญ”๊ฐ€ ๋ฉ˜ํ† ๋‹˜์„ ์ฐพ์•„์˜ค์…”์„œโ€ฆ ์œ ํ•™ ์–˜๊ธฐ๋ž‘ github ์‹ค์Šต๊นŒ์ง€โ€ฆ! ๋ชจ๋ฅด๋Š” ๊ฑฐ ์žˆ์œผ๋ฉด ํ•œ ๋ฒˆ์— ๋ชจ์•„์„œ ๋ฉ˜ํ† ๋‹˜ํ•œํ…Œ ์งˆ๋ฌธ๋„ ํ•˜๊ณ  ๊ทธ๋žฌ์–ด์š”!
  • ์œ ํ•™ ์–˜๊ธฐ๋„ ์ €๋Š” ๊ถ๊ธˆํ•ด์„œ
  • ์ €๋Š” ๋…ผ๋ฌธ์ด๋ž‘ ์ฝ”๋“œ ๊ตฌํ˜„ํ•œ ๊ฑฐ๋ž‘ 1:1 ๋งค์นญํ•˜๋Š” ๊ฒŒ ์ž˜ ์•ˆ ๋จ ใ… ใ… ใ… ใ…  ๊ทธ๊ฑฐ ๋ถ€ํƒ๋“œ๋ฆด๋ ค๊ณ ์š”.

๊ธฐํƒ€ ์‚ฌํ•ญ

  • ์—ฐ์ฃผ๋‹˜ ๋‚ด์ผ ๊ธฐ์ฐจํƒ€๋Š” ์‹œ๊ฐ„์ด๋ž‘ ๊ฒน์นจ.
  • ๋ถ€์‚ฐ์€ ๋Œ€ํšŒ ๋๋‚˜๊ธฐ ์ „์— ๋†€๋Ÿฌ๊ฐ€๋Š” ๊ฑธ๋กœ~~~~