2021 10 06 - KR-HappyFace/meetup-logs GitHub Wiki
Ice breaking
- ๊ธ์์ผ๋ ์ด๋ค ๋
ผ๋ฌธ ์ฝ์ด์ผ ํ ๊น์???
- BERT ๊ฐ ๊ฐ์ฅ ์ข์๋ณด์.
- ์์ง๋์ด 70์ ์ ๋๊ฒจ์ฃผ์
จ๋ค!
- ์ธํ๋ ๋
ผ๋ฌธ๋ฆฌ๋ทฐ??
์์ง
- k-fold๋ก ํ๋ฉด xlm roberta๊ฐ klue roberta๋ณด๋ค ์กฐ๊ธ ์ฐจ์ด๊ฐ ์์. -> klue๋ 3epochs ๋ถํฐ eval loss ์ฆ๊ฐ xlm roberta๋ 4epochs๋ถํฐ ์ฆ๊ฐ
- RBert ์ ๋ค์ ๋์ !!
- dataset์ด ๋ฌ๋ผ์ง๋ฉด resize ํ ํ์๊ฐ ์์ง ์๋??
- GRU๋ฅผ ๋ฐฑ๋ณธ model ์์ ์น๋ ์ฝ๋๋ฅผ ์์ฑ. num_layer parameter ์ง์ ํด์ฃผ๋ฉด ๋ค์ธต layer ์์์ค ์ ์์.
- concat_entity? -> ์ธํ๋ ๊ฒฝ์ฐ์๋ ์ ๊ฑฐํ์์.
- "[SEP]" ์ผ๊ด์ฒ๋ฆฌ ๋์ -> tokenizer.sep_token
ํ์
- ์ฌ๋ฆฐ ๋
ผ๋ฌธ resize๋ ์ํ๊ณ token ์ฒซ๋ฒ์งธ ์์น๋ง ๊ฐ์ ธ์์ ๋ด๋ค.
์ฐ์ฃผ
- ์์ง๋ ์ฝ๋ ๊ธฐ๋ฐ์ผ๋ก csv ์์ ์์ด->ํ๊ตญ์ด๋ก ํด์ ๋ค์ ํด๋ดค์ง๋ง ์ฑ๋ฅ ์ฐจ์ด๊ฐ ์์๋ค.
- special token ์ถ๊ฐํ ๋ฒ์ ์ผ๋ก ์คํ์ค์ ์์. -> ์ฐจ์ด๊ฐ ์์๊น?
์ฑ์ฑ
- ์ ๋์ \b ๊ฐ ์๋ค. -> ๊ธฐ์กด baseline code slicing์ผ๋ก ์ฒ๋ฆฌํด์ค์ ์๊ธฐ๋ ๋ฌธ์ ๊ฐ์.
- ์ ์ผ ์ต๊ทผ์ ์์ฑ๋ csvํ์ผ๋ก ๋๋ ธ๋๋ฐ ์ ์ถ ์ฑ๋ฅ์ด ์์ข์์ก๋ค..
์ธํ
- ALBERT ๋
ผ๋ฌธ ๋ฐํ
- Focal Loss ์ฑ๋ฅ ํ์คํ๋ค.
- RBERT ์ธํ๋์ด ๊ตฌํํ๊ฒ๊ณผ ํฐ ์ฐจ์ด๊ฐ ์์๊น?
- lstm ์ถ๊ฐ๋ก ๋ถ์ด๋๊ฒ
pretraining
- ์คํ: tokenizer๋ ๊ธฐ์กด klue bert, model์ 50epochs
- ์ฑ์ฑ: tokenizer๋ dataset์ ๋ง์ถฐ ์ ์, model 30epochs
- ์ฌ์: tokenizer๋ ๊ธฐ์กด klue bert, model์ ๊ธฐ์กด pretrain ๋ model์ ์ถ๊ฐ๋ก ๋ฐ์ดํฐ์
์ ํ์ต์์ผ์ค๋ค.