2021 10 14 - KR-HappyFace/meetup-logs GitHub Wiki

ice breaking!

  • 20λŒ€μ˜ 남녀 μ„±λΉ„κ°€ μ‹¬κ°ν•˜λ‹€... 1:1.3 μˆ˜μ€€...
  • λ―Έκ΅­ 개발자의 연봉이 μ—„μ²­λ‚˜λ‹€...! λ§€λ‹ˆμ € μˆ˜μ€€μ΄λ©΄ 거의 10얡이상....

baseline cone

  • μ½”λ“œλ₯Ό λ°”λ‘œ μ§κ΄€μ μœΌλ‘œ μ΄ν•΄ν•˜κΈ°λŠ” μ–΄λ ΅μ§€λ§Œ κΉ”λ”ν•˜κ³  μ½”λ“œκ°€ 되게 쒋은 것 κ°™λ‹€.
  • preprocessingν•˜λŠ” ν•¨μˆ˜μ—μ„œ overflow λŠ” 무슨 μ˜λ―ΈμΈκ°€μš”? max sequence length보닀 더 κΈ΄ 단락은 λ‚˜λ‰˜κ²Œ λ˜λŠ”λ° μ΄λ•Œ λ‚˜λ‰œ 단락듀이 μ›λž˜ 같은 λ‹¨λ½μ΄λΌλŠ” 것을 μ•Œλ €μ€€λ‹€. . 단락이 λ§Œμ•½ λ‚˜λˆ μ Έμ„œ μ •λ‹€λΉ„ μ—†μ„λ•ŒλŠ” 정닡라벨이 clsν† ν°μ˜ μœ„μΉ˜(0)을 κ°€λ₯΄ν‚¨λ‹€.
  • tokenizerν•˜λŠ” λ‹¨κ³„μ—μ„œ μœ λ‹ˆμ½”λ“œλ‘œ ν† ν¬λ‚˜μ΄μ§•ν•˜λ©΄ 쒋지 μ•Šμ„κΉŒμš”? ꢁ극적으둜 μœ λ‹ˆμ½”λ“œλ‘œ ν† ν¬λ‚˜μ΄μ§•μ„ ν•˜λ©΄ 쒋을 것 κ°™λ‹€! λͺ¨λ“  언어에 적용되고 λͺ¨λ“  상황에 μ μš©ν•  수 μžˆμ„ 것 κ°™λ‹€. 그런데 μ•ŒνŒŒλ²³λ‹¨κ³„μ—μ„œ λ‹€μŒμ˜ μ•ŒνŒŒλ²³μ„ μ˜ˆμΈ‘ν•˜κΈ° μœ„ν•΄μ„œλŠ” μ—„μ²­λ‚˜κ²Œ λ§Žμ€ μƒμƒμ΄μƒμ˜ ν•™μŠ΅μ΄ ν•„μš”ν•  λ“― ν•˜λ‹€. κ·Έ μ ˆμΆ©μ•ˆμœΌλ‘œ subword ν† ν¬λ‚˜μ΄μ§•μ„ ν•˜λŠ” 것 κ°™λ‹€.

mrc pretrain λͺ¨λΈλ“€

λŒ€νšŒ κ΄€λ ¨ 아이디어

  • reader와 retrieverμ΄μ™Έμ˜ λ‹€λ₯Έ λͺ¨λΈμ΄ 있으면 쒋을 μˆ˜λ„ μžˆμ„ 것 κ°™λ‹€. klueμ—μ„œ λ½€λ‘œλ‘œλ₯Ό μ΄μš©ν•΄ ner posλ₯Ό νƒœκΉ…ν•œ κ²ƒμ²˜λŸΌ 이λ₯Ό μ‘μš©ν•  μˆ˜λ„ μžˆμ„ 것 κ°™λ‹€.