2021 10 14 Baseline Office Hour - KR-HappyFace/meetup-logs GitHub Wiki

Q&A

Q. truncation์„ ํ•˜๋ฉด ์ƒˆ๋กœ์šด ์˜ˆ์ œ๊ฐ€ ๋˜๋Š”๋ฐ, stride๋ฅผ ์ค˜์„œ ์ด์ „ ์˜ˆ์ œ์™€์˜ ์—ฐ๊ฒฐ์„ฑ์„ ๋ถ€์—ฌํ•˜๋Š” ์ด์œ ๋ฅผ ์•Œ ์ˆ˜ ์žˆ์„๊นŒ์š”!? ์ €๋Š” ํ˜น์—ฌ๋‚˜ answer์ด ์ž˜๋ฆฌ๋Š” ๋ฌธ์ œ๋ฅผ ์กฐ๊ธˆ์ด๋ผ๋„ ๋” ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•จ์ด๋ผ๊ณ  ์ƒ๊ฐํ–ˆ์Šต๋‹ˆ๋‹ค.!

  • ํ•˜๋‚˜์˜ ์ธํ’‹์ด ๊ธธ์ด๊ฐ€ ๋„ˆ๋ฌด ๊ธธ์–ด์ง€๊ฒŒ ๋˜๋ฉด PLM์„ ์‚ฌ์šฉํ•  ๊ฒฝ์šฐ์—๋Š” max len์„ ์„ค์ •ํ•ด์ค„ ์ˆ˜ ๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ํ•ด๋‹น ๊ฐ’์œผ๋กœ truncate๋งŒ ํ•ด์ฃผ๊ฒŒ ๋  ๊ฒฝ์šฐ ์šฐ๋ฆฌ๋Š” ๋ฌธ์žฅ์˜ ์•ž์ชฝ fragment๋งŒ ํ•™์Šต์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๊ธด ๊ธธ์ด์˜ ๋ฌธ์žฅ๋„ PLM์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๋ฉด์„œ + ๋’ท์ชฝ ๋ฌธ์žฅ๋„ ๊ฐ™์ด ๋ณด๊ธฐ์œ„ํ•ด์„œ stride๋ฅผ ์‚ฌ์šฉํ•˜๊ณ , ์ตœ๋Œ€ํ•œ ์•ž์ชฝ context๋ฅผ ๋ฐ˜์˜ํ•˜๊ธฐ ์œ„ํ•ด ์—ฐ๊ฒฐ์„ฑ์„ ๋ฐฉ์ง€ํ•ฉ๋‹ˆ๋‹ค. ( answer์ด ์ž˜๋ฆฌ๋Š” ๋ฌธ์ œ๋Š” stride๋ฅผ ๊ฑธ์–ด๋„ ์ƒ๊ธฐ๊ธด ํ•ฉ๋‹ˆ๋‹ค)

Q. ๋‹ต๋ณ€ํ•ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค! ๋งŒ์•ฝ A๋ผ๋Š” sequence๊ฐ€ ๋‘˜๋กœ ๋‚˜๋‰˜์–ด์ ธ์„œ A-1 / A-2๋กœ ์ชผ๊ฐœ์ง„๋‹ค๋ฉด, doc_stride๊ฐ€ ๋ฐ˜์˜๋˜๋Š” ๋ถ€๋ถ„์€ A-2์ผํ…๋ฐ(A-1์˜ ๋๋ถ€๋ถ„ ํฌํ•จํ•˜๋ฏ€๋กœ), ๋ฌธ์žฅ์˜ ์•ž์ชฝ fragment๋งŒ ํ•™์Šต์„ ํ•˜๊ฒŒ ๋œ๋‹ค๋Š” ๋ง์”€์ด ์–ด๋–ค ์˜๋ฏธ์ธ์ง€ ์•Œ ์ˆ˜ ์žˆ์„๊นŒ์š”! ์ตœ๋Œ€ํ•œ ์•ž์ชฝ context๋ฅผ ๋ฐ˜์˜ํ•˜๊ธฐ ์œ„ํ•ด ์—ฐ๊ฒฐ์„ฑ์„ ๋ฐฉ์ง€ํ•œ๋‹ค๋Š” ๋ง์”€๋„ ์ดํ•ด๋ฅผ ๋ชป ํ–ˆ์Šต๋‹ˆ๋‹ค..! ๊ดœ์ฐฎ์œผ์‹œ๋‹ค๋ฉด ์ถ”๊ฐ€ ์„ค๋ช…์„ ๋ถ€ํƒ๋“œ๋ ค๋„ ๋ ๊นŒ์š”๐Ÿ™!

  • (์ œ๊ฐ€ ๋‹จ์–ด๋ฅผ ์ž˜๋ชป์ผ๋Š”๋ฐ ์—ฐ๊ฒฐ์„ฑ์„ ๋ฐฉ์ง€ํ•˜๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ ์œ ์ง€ํ•˜๋Š”๊ฒƒ์ž…๋‹ˆ๋‹ค ใ… ใ… ) ๋ง๋ถ™์—ฌ์„œ ๋ง์”€๋“œ๋ฆฌ์ž๋ฉด ๋™์ผํ•œ ์งˆ๋ฌธ์ด ๋“ค์–ด์™”์„ ๋•Œ answer๊ฐ€ ์™„์ „ํžˆ ๊ตฌ๋ถ„๋˜์–ด์„œ ๋‹ฌ๋ผ์ ธ๋ฒ„๋ฆฐ๋‹ค๋ฉด ๋ชจ๋ธ์ด ํ—ท๊ฐˆ๋ ค ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค ใ…Žใ…Ž ๊ทธ๋Ÿฌ๋‹ˆ context๋ฅผ ์กฐ๊ธˆ ๋” ๊ณ ๋ คํ•ด์ฃผ๋Š”์‹์œผ๋กœ ๋ชจ๋ธ์„ ๊ตฌํ˜„ํ•˜๊ณ  ์žˆ์–ด์š”.

Q. tokenizer ๋•Œ๋ฌธ์— [๋ฐ์ดํ„ฐ์…‹์ƒ ์ •๋‹ต]๊ณผ [๋ชจ๋ธ์ด ํ•™์Šตํ•˜๋Š” ์ •๋‹ต]์ด ๋‹ค๋ฅด๊ฒŒ ๋˜๋Š”๋ฐ ์ด๋Ÿฐ ๋ฌธ์ œ๋Š” ์–ด๋–ป๊ฒŒ ํ•ด๊ฒฐํ•˜๋ฉด ์ข‹์„๊นŒ์š”? ์˜ˆ๋ฅผ ๋“ค์–ด ์ •๋‹ต์ด '๊ฐ•์•„์ง€ ํ’€'์ธ๋ฐ, ์ •๋‹ต์— ๋Œ€ํ•œ ํ† ํฐํ™”๊ฐ€ '๊ฐ•##', 'UNK', 'ํ’€' ์œผ๋กœ ๋œ ๊ฒƒ์ฒ˜๋Ÿผ

  • ํ•ด๋‹น ๊ฒฝ์šฐ์—๋Š” ๋ชจ๋ธ์˜ ์ •๋‹ต์„ ๋ฐ”๋กœ ์‚ฌ์šฉํ•˜๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ, ํ›„์ฒ˜๋ฆฌ ๊ณผ์ •์—์„œ post process๋ฅผ ํ†ตํ•ด tokenized ๊ฐ’์„ decoding ์„ ํ†ตํ•ด ํ•ฉ์ณ์ฃผ๋Š” ๊ณผ์ •์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋ง์”€ํ•˜์‹œ๋Š” ์˜ˆ์ œ๊ฐ™์€ ์ผ€์ด์Šค๊ฐ€ ๋ฐœ์ƒํ•  ๊ฒฝ์šฐ์—๋Š” ์ •ํ™•ํ•˜๊ฒŒ ํ•ฉ์น˜์ง€ ๋ชปํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜๋Š” ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋‹ค๋งŒ roberta ๋ชจ๋ธ์ด๋ผ๋ฉด ์ €๋Ÿฐ์‹์œผ๋กœ ๋‹จ์–ด ์‚ฌ์ด์— unk ๊ฐ€ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ด ๋งค์šฐ ๋‚ฎ์Šต๋‹ˆ๋‹ค (๊ต‰์žฅํžˆ ํฐ vocab์„ ๊ฐ€์ง€๋ฏ€๋กœ)

Q. stride์„ ๊ฑธ์–ด๋„ answer๊ฐ€ ์ž˜๋ฆฌ๋Š” ๊ฒฝ์šฐ๋Š” ๊ทธ๋Ÿฌ๋ฉด ์™„์ „ํžˆ ํ•ด๊ฒฐ์ด ๋ถˆ๊ฐ€๋Šฅํ•œ ๋ฌธ์ œ์ธ๊ฐ€์š”? ๊ทธ๋ƒฅ ๋‚ฎ์€ ํ™•๋ฅ ์— ๋งž๊ธฐ๋Š” ์ˆ˜๋ฐ–์— ์—†๋Š” ๊ฒƒ์ผ๊นŒ์š”?

  • ๋„ค ๊ทธ๋Ÿฐ ๊ฒฝ์šฐ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ด๋Ÿฐ ๋ฌธ์ œ๊ฐ€ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ตœ๊ทผ์— long sequence ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ชจ๋ธ์ด ๋‚˜์˜ค๊ณ  ์žˆ์ฃ  !

Q. context๊ฐ€ ๋‘๊ฐœ๋กœ ์ž˜๋ ธ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๊ณ , answer๊ฐ€ ์ž˜๋ฆฐ ๋‘๊ฐœ์˜ context์— ๋ชจ๋‘ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ–ˆ์„๋•Œ, ๋‘๊ฐœ์˜ ์ •๋‹ต์ด tokenized_examples์— ์ €์žฅ๋ ๊นŒ์š”?

  • yes

  • ๊ณผ์ œ๊ฐ€ baseline ํŒŒ์•…์— ๋„ˆ๋ฌด๋„ˆ๋ฌด ๋„์›€์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค ใ…Žใ…Žใ…Ž

  • import *์€ ํ•˜์ง€ ์•Š๊ธฐ๋กœ ใ…Žใ…Ž,,, ์–ด๋””์—์„œ ์˜ค๋Š” ์ง€ ์•Œ ์ˆ˜ ์—†๋‹ค,.

Recommendations

Q. extraction-based๋ž‘ generation-based mrc์˜ ๊ฒฐ๊ณผ๋ฅผ ์•™์ƒ๋ธ”ํ•  ์ˆ˜๋„ ์žˆ๋‚˜์š”!! .. ์–ด๋–ค์‹์œผ๋กœ output์•™์ƒ๋ธ”์ด ๊ฐ€๋Šฅํ•œ ์ง€ ๋” ์—ฌ์ญค๋ด๋„ ๋ ๊นŒ์š”!

  • BLUE Score์ผ ์ˆ˜๋„ ์žˆ๊ณ , Rule base๋กœ ๊ฑธ๋Ÿฌ์„œ ์–ด๋–ค ๋ชจ๋ธ์˜ output์„ ์„ ํƒํ•  ๊ฒƒ์ธ์ง€์˜ ensemble๋กœ ๋ณด์…”๋„ ๋  ๊ฒƒ ๊ฐ™๊ณ .
  • ์•„๋‹ˆ๋ฉด ๋‹จ์ผ ๋ชจ๋ธ๋กœ extraction-based์™€ generation-based๋ฅผ ํ•ฉ์ณ๋„ ๋ฉ๋‹ˆ๋‹ค. extraction-based๋‚˜ generation-based๋Š” encoder์„ ํ™œ์šฉํ•˜๋Š” ๊ฑฐ๊ธฐ ๋•Œ๋ฌธ์—, loss๋ฅผ ๊ฐ™์€ ๊ฑธ ์“ฐ๊ณ  backpropogation์„ ๊ฐ™์ด ํ•  ์ˆ˜ ์žˆ์„ ๊ฒ๋‹ˆ๋‹ค. ์ด๊ฑด ์—ฌ๋Ÿฌ๋ถ„๋“ค์ด ์‹œ๋„๋ฅผ ํ•ด๋ณด์‹œ๊ณ .

Q. MRC์ฑŒ๋ฆฐ์ง€์—์„œ korquad๋กœ pretrained๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด๋„ ๋˜๋‚˜์š”? ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์…‹์€ ์‚ฌ์šฉ๋ง๋ผ๊ณ  ์จ์ €์žˆ๊ธดํ•œ๋ฐ ๊ธฐํ•™์Šต ๊ฐ€์ค‘์น˜๋Š” ์ œํ•œ์—†์ด ํ—ˆ์šฉ๋œ๋‹ค๊ณ  ํ•ด์„œ ๊ทธ๋ ‡์Šต๋‹ˆ๋‹ค.

  • KorQuad๋กœ ์ €์žฅ๋˜์–ด ์žˆ๋Š” ๋ชจ๋ธ์„ finetuningํ•˜๋Š” ๊ฒƒ์„ ํ—ˆ์šฉํ•  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.
  • ์ด์ „์— ๊ณต์ง€๋“œ๋ ธ๋“ฏ์ด, ๊ธฐํ•™์Šต ๊ฐ€์ค‘์น˜ (pretrained weight) ์‚ฌ์šฉ์— ์ œํ•œ์€ ์—†์Šต๋‹ˆ๋‹ค.
  • ๋‹ค๋งŒ KLUE MRC ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต๋œ ๊ธฐํ•™์Šต ๊ฐ€์ค‘์น˜ ์‚ฌ์šฉ์€ ๊ธˆ์ง€ํ•ฉ๋‹ˆ๋‹ค. KLUE ํ”„๋กœ์ ํŠธ์—์„œ ๊ณต๊ฐœ๋œ KLUE MRC ๋ฐ์ดํ„ฐ์…‹์˜ ์ผ๋ถ€๋Š” ํ˜„ ๋ฆฌ๋”๋ณด๋“œ ํ…Œ์ŠคํŠธ์…‹์„ ํฌํ•จํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ KLUE MRC ๋ฐ์ดํ„ฐ๋กœ ๊ธฐํ•™์Šต๋œ ๊ฐ€์ค‘์น˜๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์€ โ€˜ํ…Œ์ŠคํŠธ์…‹์„ ๋ถ„์„ํ•˜๊ณ  ์‚ฌ์šฉ(ํ•™์Šต)ํ•˜๋Š” ํ–‰์œ„์ด๊ธฐ ๋•Œ๋ฌธ์— ๋ณธ ๋Œ€ํšŒ์™€ ๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech ํ•™์Šต์—์„œ๋Š” ๊ธˆ์ง€ํ•ฉ๋‹ˆ๋‹ค.
  • ์ถ”๊ฐ€์ ์œผ๋กœ ๋Œ€ํšŒ ์ฐธ๊ฐ€์ž ๋ถ„๋“ค์€ ์‚ฌ์šฉํ•˜๋Š” ๊ธฐํ•™์Šต ๊ฐ€์ค‘์น˜๋ฅผ ๊ณต์ง€๊ฒŒ์‹œํŒ์˜ โ€˜๊ธฐํ•™์Šต ๊ฐ€์ค‘์น˜ ๊ณต์ง€โ€™ ๊ฒŒ์‹œ๊ธ€์— ๋Œ“๊ธ€๋กœ pretrained weight ์ •๋ณด์™€ ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ๋งํฌ(link)๋ฅผ ๋ฐ˜๋“œ์‹œ ๊ณต์œ  ๋ถ€ํƒ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ์ด๋ฏธ ๊ณต์œ ๊ฐ€ ๋˜์–ด ์žˆ์„ ๊ฒฝ์šฐ ์ถ”๊ฐ€๋กœ ๊ณต์œ ์ฃผ์‹ค ํ•„์š”๋Š” ์—†์Šต๋‹ˆ๋‹ค.
  • ์˜คํ”ผ์Šค์•„์›Œ์—์„œ ๋ง์”€๋“œ๋ฆฐ ๊ฒƒ์ฒ˜๋Ÿผ, ์žฌ๋ฏธ์žˆ๋Š” ์•™์ƒ๋ธ” ๋ชจ๋ธ๋„ ๋งŒ๋“ค์–ด ๋ณด์‹ค ์ˆ˜ ์žˆ์œผ๋‹ˆ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ๋ชจ๋ธ๋ง์„ ํ•ด๋ณด์‹œ๋Š”๊ฑธ ์ถ”์ฒœ๋“œ๋ฆฝ๋‹ˆ๋‹ค :pray: :pray:

Q. mrc ์ด์™ธ์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด์„œ ๋ชจ๋ธ์„ ์ค‘๊ฐ„์ค‘๊ฐ„์— inferenceํ•˜๋ฉด์„œ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์€ ํ—ˆ์šฉ๋˜๋Š”๊ฑด๊ฐ€์š”?

  • ๋„ค.

Useful MRC Reference