Week11 Day3 - ai-esg/our-history GitHub Wiki

ํŒ€ NLP 11์กฐ Week11 Day3

๋ชฉ์ฐจ

์ผ์ž

  • 2021.10.14 ๋ชฉ

ํŒ€์›

  • ๋ฌธ์„์•”_T2075
  • ๋ฐ•๋งˆ๋ฃจ์ฐฌ_T2078
  • ๋ฐ•์•„๋ฉ˜_T2090
  • ์šฐ์›์ง„_T2137
  • ์œค์˜ํ›ˆ_T2142
  • ์žฅ๋™๊ฑด_T2185
  • ํ™ํ˜„์Šน_T2250

์ฃผ๊ฐ„ ์ผ์ •

ํ”ผ์–ด์„ธ์…˜

๊ณ„ํš ์ˆ˜๋ฆฝํ•˜๊ธฐ

  • MRC ๋…ผ๋ฌธ์—์„œ ์ œ์‹œํ•œ ๋ชจ๋ธ ๊ณ ๋ ค.
  • baseline ์ฝ”๋“œ, ์ž…์ถœ๋ ฅ์— ๊ด€ํ•œ ์„ค๋ช…์„ ์ค€๋น„ํ•ด๋ณด์ž. (ํŒ€ ๋ถ„๋ฐฐ ์ฐธ๊ณ )

ํŒ€ ๋ถ„๋ฐฐ

baseline ์ฝ”๋“œ ๊ด€๋ จํ•ด์„œ ๋ถ„์„. ํŒ€๋ณ„๋กœ ์•Œ์•„์„œ ํ•  ๊ฒƒ.

  • Reader

    • ๋ฐ•๋งˆ๋ฃจ์ฐฌ
    • ์šฐ์›์ง„
    • ์œค์˜ํ›ˆ
    • ํ™ํ˜„์Šน
  • Retrieval

    • ๋ฌธ์„์•”
    • ์žฅ๋™๊ฑด
    • ๋ฐ•์•„๋ฉ˜

๊ฐ•์˜ ๋ฐœํ‘œ

๊ฐ•์˜ ๋ฐœํ‘œ (5~10๋ถ„ ์‚ฌ์ด) 4 - ์šฐ์›์ง„ 5 - ๋ฌธ์„์•” 6 - ์œค์˜ํ›ˆ 7 - ๋ฐ•๋งˆ๋ฃจ์ฐฌ

์ƒ๊ธด ์งˆ๋ฌธ์€ github discussion์— ์ž‘์„ฑ.

  • ๋‹ต๋ณ€๊ณผ ํ† ๋ก ์€ ์ž์œ ๋กญ๊ฒŒ ์ž‘์„ฑ.

๋ฉ˜ํ† ๋ง

์ผ์ • ์กฐ์œจ

  • ๋‹ค์Œ์ฃผ ๊ธˆ์š”์ผ 6์‹œ

๋‚ด์šฉ

  1. 1๊ธฐ MRC ๋ฉ˜ํ† ๋ถ„๋“ค์˜ ์ž‘ํ’ˆ์ด๋‹ค..
  2. elasticsearch, pororo
    • ์™€์šฐ ์—˜๋ผ์Šคํ‹ฑ์„œ์น˜.....
  3. ๋ชจ๋ธ ์„ ์ •์‹œ klue ๊ด€๋ จ pre-trained model์€ ์‚ฌ์šฉํ•˜์ง€ ์•Š์•„์•ผ ํ•จ.
    • ๋ฐ์ดํ„ฐ์…‹์ด klue์˜ ๋ถ€๋ถ„์ง‘ํ•ฉ์ด๊ธฐ ๋•Œ๋ฌธ. ์ผ์ข…์˜ cheating.
  4. ์ถ”๊ฐ€ ๊ณผ์ œ๊ฐ€ ์Šฌ๋ž™์— ๋‚˜๊ฐ‘๋‹ˆ๋‹ค.
  5. ์ฑ„์šฉ ์ง€์›์€ ๋งŽ์ด ํ•ด ๋ด๋ผ. ์ฝ”ํ…Œ์™€ ๋ฉด์ ‘ ๊ฒฝํ—˜์€ ๋งŽ์„์ˆ˜๋ก ์ข‹๋‹ค.
    • ํ•œ ์ฃผ์— ํ•œ ๋ฒˆ ์žˆ๋Š” ์œ„ํด๋ฆฌ ์ฑŒ๋ฆฐ์ง€(ํ”„๋กœ๊ทธ๋ž˜๋จธ์Šค) ๋ฌธ์ œ ํ’€์–ด๋ณด์‹ค๋ž˜์š”?

์ฝ”๋“œ ํ”ผ๋“œ๋ฐฑ

  • ์‚ฌ๋žŒ๋ณ„๋กœ ์ฝ”๋“œ๊ฐ€ ํ†ต์ผ์ด ์•ˆ ๋˜์–ด ์žˆ๋‹ค
    • ์ฝ”๋”ฉ ์Šคํƒ€์ผ์— ๋Œ€ํ•œ linter๋ฅผ ์ ์šฉํ•  ํ•„์š”๊ฐ€ ์žˆ์–ด ๋ณด์ธ๋‹ค.
    • type hint ์ ์šฉํ•ด์ฃผ์„ธ์š”!

์งˆ๋ฌธ ๋‹ต๋ณ€

  • inner product ์™œ ์“ฐ๋‚˜์š”?

    • cosine similarity์™€์˜ ์ฐจ์ด :
    • ๊ฑฐ์˜ ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ํฌ๊ธฐ๋งŒ ๋‹ค๋ฆ„
    • ์›์†Œ์˜ ํฌ๊ธฐ ordering์€ ๋‹ฌ๋ผ์ง€์ง€ ์•Š์Œ
    • ์˜ˆ์‹œ์˜ 100์€ ๊ต‰์žฅํžˆ edgeํ•œ ์ผ€์ด์Šค ์ผ ๊ฒƒ
    • ์ด๋Ÿฐ ์—ฃ์ง€ ์ผ€์ด์Šค๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค๋ฉด ๋ชจ๋ธ์ด ์ •์ƒ์ ์œผ๋กœ ์ž‘๋™ํ•˜์ง€ ์•Š๋Š” ๊ฒƒ์ผ ๊ฒƒ์ด๋‹ค.
    • ๋Œ€๋ถ€๋ถ„ ์ž…๋ ฅ๊ฐ’์ด scale ๋˜์–ด ์žˆ์–ด์„œ ์ €๋Ÿฐ ๋ฌธ์ œ๊ฐ€ ์ƒ๊ธฐ์ง€ ์•Š์„ ๊ฒƒ
    • ์—ฐ์‚ฐ ์†๋„์— ๋Œ€ํ•œ ์ด์ ์ด ์žˆ๋‹ค.
  • Normalize ํ•ด์ค˜๋„ ์ƒ๊ด€์€ ์—†์ฃ ?

    • ๋„ต
  • span ์ฐพ๋Š” ๋ฌธ์ œ์—์„œ, Bert ์ถœ๋ ฅ ์ค‘ context ๋ถ€๋ถ„๋งŒ ์‚ฌ์šฉํ•˜๋Š”๊ฐ€?

    • 1๊ธฐ ๋•Œ question ๋ถ€๋ถ„๋„ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๊ฐ€ ์žˆ์—ˆ๋‹ค.
  • Bert ๋งจ ๋๋‹จ์— ๋ญ๊ฐ€ ๋‚˜์˜ค๋‚˜์š”? z์ธ๊ฐ€์š”?

    • ์ดํ›„์— ์ •ํ™•ํ•œ ๋‹ต๋ณ€์„ ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค.
  • Attention mask, token type id ์ž…๋ ฅ์— ๊ณฑํ•ด์ ธ์„œ ๋“ค์–ด๊ฐ€๋‚˜์š”?

    • ๋„ค, ์ž์„ธํ•œ ๊ฒƒ์€ ํ™•์ธํ•ด๋ด์•ผ ๋˜์ง€๋งŒ ๊ทธ๋Ÿด ๋“ฏ ํ•ฉ๋‹ˆ๋‹ค.
  • MRC๊ฐ€ ๊ฒ€์ƒ‰ ๋Œ€๋น„ ์–ด๋–ค ์žฅ์ ์„ ๊ฐ€์ง€๋Š”์ง€

    • MRC๊ฐ€ ์™œ ํ•„์š”ํ•œ๊ฐ€ -> ์–ด๋–ค ์žฅ์ ์„ ๊ฐ€์ ธ๋‹ค ์ค„์ˆ˜์žˆ๋Š”๊ฐ€

๊ณผ์ œ

  • Maxpooling -> Relu, Relu -> Maxpooling : ๋‹จ์กฐ์ฆ๊ฐ€ ํ•จ์ˆ˜์ผ ๊ฒฝ์šฐ ๋ชจ๋‘ ์„ฑ๋ฆฝ