2021 10 18 - KR-HappyFace/meetup-logs GitHub Wiki
- DPR ๋
ผ๋ฌธ์ ์ ์๋ฏธํ ๋ด์ฉ์ด ๋ง์ ๊ฒ ๊ฐ๋ค: ์ฑ์ฑ
- Entity marker ์ถ๊ฐํ๊ธฐ: ์คํ
- sparse vs dense ์คํ: ์ฌ์
- Baseline vs DPR mean one encoder. ์ด๊ฑด ๊นํ์ ์
๋ก๋ํด๋๊ฒ ๋ค.
- ํ๊ท ๋ด๋ ๋ฐฉ๋ฒ์ด ์ข์ ๊ฒ ๊ฐ์๋ฐ, pad token ๋นผ๊ณ ํ๋ ๊ฑด ์ด๋ป๊ฒ ํ๋ ๊ฒ ์ข์ง ์์๊น. ๋ฌธ์ฅ์ด ๊ธธ์ด์ ์ ๋งํ๋ฉด ๊ฝ๊ฝ ์ฑ์์ ๋ค์ด๊ฐ ๊ฒ ๊ฐ์๋ฐ. Padding์ด ๋ง์ด ๋ค์ด๊ฐ ๊ฒ๋ค์ padding ์ ์ธํ๊ณ ํ๊ท ๋ด๋ฉด ์ข์ ๊ฒ ๊ฐ๋ค๊ณ ์๊ฐํด๋ดค์ต๋๋ค.
- MRC ์ชฝ์ Custom Model ๋ฐฉ๋ฒ๋ก ์ด ์๋ ๊ฒ ์๋๋ผ Big Bird ๊ฐ์ Pretrained ๋ ๋ชจ๋ธ์ด ์๋๋ผ๊ณ ์. Long BERT ๊ฐ์ ๊ฑด ํ๊ตญ์ด๋ก ์์ง ์์๊น ์๊ฐํ๊ธด ํ๋๋ฐ.
- Pretrain์ ๋ชป์ํค๋? ๊ฐ๋ฅ์ ํ ๊ฒ ๊ฐ์๋ฐ. ๋ง ๊ฐ์์๋ KLUE MRC ์ฐ๊ณ ์ถ๋ค์.
- [MASK]๋ฅผ ๋๋ค์ผ๋ก ์์๋ณด๋ ค๋ ์คํ์ ํ๊ณ ์์.
- Retriever์ ๊ทธ๋๋ ์ด๋ป๊ฒ ํด๋ณผ ์ ์๋๋ฐ, Reader์ ์ด๋ป๊ฒ ์ฑ๋ฅ ํฅ์์ ์ํฌ์ง ๋ชจ๋ฅด๊ฒ ๋ค.
- Retriever์ผ๋ก๋ถํฐ ์จ passage๋ค ์ค์์ ๋ช ๊ฐ๋ฅผ ์ฐ๋ฆฌ๊ฐ ๋ค์ ์ฌ์ฉ์ ํ ๊ฒ์ธ์ง, negative passage๋ก ์ฌ์ฉ์ ํ ๊ฒ์ธ์ง hyperparameter๋ก ์ฌ์ฉํ ์ ์๋ค.
- T5๋ ๊ณ ์ ๋ช
์ฌ์๋ค๊ฐ Masking์ ํ๋๋ผ๊ณ ์. ๊ทธ๋ ๊ฒ ๊ณ ์ ๋ช
์ฌ๋ฅผ Maskingํด์ ๊ณ ์ ๋ช
์ฌ๋ฅผ ๋ง์ถ๊ฒ ํ๋ฉด ๊ทธ๋ฐ ๋ฌธ๋งฅ์ด ๊ฐ๊ณ ์๋ ์ ๋ณด๋ ๋ ๊ฐ๊ณ ์ค์ง ์์๊น?
- Special Mission 2 Generation Based MRC์์ ๋ฌธ์ ๊ฐ ์๋ ๊ฒ ๊ฐ๋ค.