Week12 Day4 - ai-esg/our-history GitHub Wiki

ํŒ€ NLP 11์กฐ Week12 Day4

๋ชฉ์ฐจ

์ผ์ž

  • 2021.10.21 ๋ชฉ

ํŒ€์›

  • ๋ฌธ์„์•”_T2075
  • ๋ฐ•๋งˆ๋ฃจ์ฐฌ_T2078
  • ๋ฐ•์•„๋ฉ˜_T2090
  • ์šฐ์›์ง„_T2137
  • ์œค์˜ํ›ˆ_T2142
  • ์žฅ๋™๊ฑด_T2185
  • ํ™ํ˜„์Šน_T2250

์ฃผ๊ฐ„ ์ผ์ •

ํ”ผ์–ด์„ธ์…˜

์ถ”๊ฐ€ ๊ฒฐ์ •์‚ฌํ•ญ

  • ์ฝ”๋“œ ์ดํ•ด๋ฅผ ์œ„ํ•ด PR์‹œ 6๋ช… approve๋ฅผ ๊ธฐ๋Œ€ํ•ด๋ณด์ž.
  • ํ”ผ์–ด์„ธ์…˜์—์„œ ์ฝ”๋“œ๋ฆฌ๋ทฐ๋ฅผ ํ•ด ๋ณด์ž (์ตœ๋Œ€ํ•œ ๋น ๋ฅด๊ฒŒ)

ํŒ€ ๋ถ„๋ฐฐ

  • Reader

    • ์šฐ์›์ง„
    • ์œค์˜ํ›ˆ
    • ํ™ํ˜„์Šน
  • Retrieval

    • ๋ฌธ์„์•”
    • ์žฅ๋™๊ฑด
    • ๋ฐ•์•„๋ฉ˜
    • ๋ฐ•๋งˆ๋ฃจ์ฐฌ

ํ˜„์Šน๋‹˜ ๋ฉด์ ‘ ์ด์•ผ๊ธฐ

  • deep learning๊ณผ machine learning์˜ ์ฐจ์ด
  • ai tech ๋ฉด์ ‘ ๋ชจ์Œ ์ฐธ๊ณ ๊ฐ€ ๋„์›€
  • ํ–ˆ๋˜ ํ”„๋กœ์ ํŠธ ๋ฌผ์–ด๋ดค์Œ

Retrieval

  • ์„ฑ๋Šฅ์ด ๋„ˆ๋ฌด ๋‚˜์˜๋‹ค. ๋น ๋ฅด๊ฒŒ dense embedding์„ ๊ตฌํ˜„ํ•˜์ž.
  • Dense embedding ๊ณต๋ถ€ํ•˜๊ณ  ๋ฐœํ‘œ, ๊ตฌํ˜„ (๋ฐ•๋งˆ๋ฃจ์ฐฌ)
  • ๋ชฉํ‘œ
    1. retrieval ํ‰๊ฐ€ ์ฒ™๋„
      • f1,re,pre,acc
    2. Refactoring (๊ฐ์ž ์ ์šฉํ•˜๊ณ  PR)
    3. elasticsearch ๋„์ž… ํ›„ ๊ธฐ์กด๊ณผ ๋น„๊ต
    4. ํ˜ผํ•ฉํ•ด์„œ ์‚ฌ์šฉ(elasticsearch, sparse, dense..)
  • ํ•™์Šต์ด ์ž˜ ๋˜์ง€ ์•Š๋Š”๋‹ค. ์ด์ƒํ•œ๊ฑธ ํ•™์Šตํ•œ๋‹ค.
    • negative์™€ positive๋ฅผ ๋žœ๋คํ•˜๊ฒŒ ์„ž์–ด์„œ ํ•™์Šต์‹œ์ผœ๋ณด์ž

data ๋ถ„์„ (+ ๊ฐ ํŽ˜์ด์ฆˆ๋ณ„ input - output)

  • ์‹œ๊ฐ„์ด ๋‚จ๊ฑฐ๋‚˜, ๋‹ค์Œ ๋„์ „์ด ์–ด๋ ต๋‹ค๋ฉด ์งฌ์„ ๋‚ด์„œ ์‹œ๋„ํ•ด ๋ณด์ž. ๋น ๋ฅผ์ˆ˜๋ก ์ข‹๋‹ค.
  • max_length retrieval ์„ฑ๋Šฅ๊ณผ์˜ ๊ด€๊ณ„?
  • ์™ธ๊ตญ์–ด 10๊ฐœ ์ด์ƒ ๋ฌธ์žฅ์€ ์ œ์™ธ (์ „์ฒ˜๋ฆฌ ์ง„ํ–‰)
  • URL ํƒœ๊ทธ๋“ฑ์ด ์ œ๊ฑฐ๋˜์ง€ ์•Š์€ ๋ถ€๋ถ„์ด ์กด์žฌํ•œ๋‹ค (๋‹ค์‹œ ์ „์ฒ˜๋ฆฌ ํ•œ๋ฒˆ์€ ํ•ด์ค„ํ•„์š”๊ฐ€ ์žˆ๋‹ค.)
  • docs title ์€ ๊ณผ์—ฐ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ ์ˆ˜ ์žˆ์„๊นŒ??

Retriever

  • retriever NLLLoss์˜ target index๋ฅผ zeros๋กœ ์ฃผ๋А๋ƒ arange๋กœ ์ฃผ๋А๋ƒ?
    • ์™œ zeros๋กœ ํ–ˆ์„ ๋•Œ loss๊ฐ€ 0์ด ๋˜์ง€?

      • ์ˆ˜๋ ด์ด iter 2๋ฒˆ๋งŒ์— ๋œ๋‹ค
    • ์–ด๋–ค ์ฟผ๋ฆฌ๋ฅผ ๋„ฃ๋˜ ๊ฐ„์— ๊ฐ™์€ context๊ฐ€ ๊ฐ€์žฅ ์œ ์‚ฌํ•œ context๋ผ๊ณ  ๋œฌ๋‹ค.

    • ํ•™์Šต์„ ์‹œํ‚ค์ง€ ์•Š์€ ๋ชจ๋ธ๋„ ๋˜‘๊ฐ™์€ ๊ฒฐ๊ณผ โ†’ ์ฝ”๋“œ ์ƒ์˜ ๋ฌธ์ œ?

    • NLLLoss์˜ target๋ฅผ [1, 1]๋กœ ํ•™์Šตํ•˜๋ฉด ๋‹จ์„œ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์ง€ ์•Š์„๊นŒ? - ์•„๋ฉ˜๋‹˜

      • ๊ฒฐ๊ณผ: ์ฒซ๋ฒˆ์งธ ์ธ๋ฑ์Šค๋ฅผ 0์œผ๋กœ ๋ณด๋ƒ„ [0, 0]์˜ ๊ฒฝ์šฐ์™€ ๋˜‘๊ฐ™๋‹ค?
      • batch ์ˆœ์„œ๋ฅผ 2๋ฒˆ๋งŒ์— ์•Œ์•„๋ƒˆ๋‹ค?
    • ์—ฌ๊ธฐ์„œ๋Š” batch ์ค‘ ์ •๋‹ต์„ ์ฐพ๋Š” ๊ณผ์ •์ด๋ฏ€๋กœ(ํ•˜๋‚˜๋งŒ ์ •๋‹ต ๋‚˜๋จธ์ง€ ์˜ค๋‹ต) โ†’ classification ๋ฌธ์ œ - ์›์ง„๋‹˜

      • [0, 0]์ด๋ฉด ๊ฒฐ๊ตญ ๋ชจ๋‘ ์˜ค๋‹ต์œผ๋กœ ์ƒ๊ฐํ•ด์„œ loss๊ฐ€ 0
    • negative sample์˜ ๊ฐœ์ˆ˜๋ฅผ ๋Š˜๋ ค๋ณผ๊นŒ? -์›์ง„๋‹˜

    • ์™œ ์‹ค์Šต์ฝ”๋“œ์™€ ๋˜‘๊ฐ™์€ ์‹คํ–‰์ธ๋ฐ ์™œ ๋‹ค๋ฅธ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ๊นŒ?

    • klue๋ฅผ ์“ฐ๋“  bert-base-multilingual ์“ฐ๋“  ๋˜‘๊ฐ™์€ ํ˜„์ƒ

Reader

  • Roberta์™€ Bert์˜ ์ฐจ์ด ์•Œ์•„๋ณด๊ธฐ
  • token ์ž„๋ฒ ๋”ฉ + ๋ฌธ์žฅ ์ „์ฒด์˜ cls ํ† ํฐ
  • query์˜ ์ž„๋ฒ ๋”ฉ์„ ํ† ํฐ์—๋‹ค concat โ†’ fully connected layer
  • ๋‹จ์ผ ๋ชจ๋ธ ์„ฑ๋Šฅ์€ klue/roberta-large
  • klue + XLNet ์•™์ƒ๋ธ” ์‹œ๋„ํ•ด๋ณด๊ธฐ
    • ํ•œ๊ตญ์–ด๋กœ ๊ธฐํ•™์Šต๋œ ๋ชจ๋ธ๋“ค ์ค‘ ์„ฑ๋Šฅ์ด ์ค€์ˆ˜ํ•œ ๋ชจ๋ธ๋“ค์„ ์•™์ƒ๋ธ” ๊ณ ๋ คํ•ด๋ณด๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™์Œ.
    • ์‚ฌ์šฉํ•˜๋ฉด ์•ˆ ๋˜๋Š” ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ฃผ์˜๊ฐ€ ํ•„์š”

Elastic Search

  • ์ž๋ฃŒ
  • ReaderํŒ€์ด ์‹œ๊ฐ„๋‚จ์œผ๋ฉด ์‹œ๋„ํ•ด๋ณด์ž

General

  • NLLLoss์™€ CrossEntropy์™€ ๋ญ๊ฐ€ ๋‹ค๋ฅธ๊ฑฐ์ง€?