2021 09 28 - KR-HappyFace/meetup-logs GitHub Wiki
- ๋ชฉ์์ผ์ ์๊ณ ๋ฆฌ์ฆ vs ๋ ผ๋ฌธ๋ฆฌ๋ทฐ -> ์ผ๋จ ์๊ณ ๋ฆฌ์ฆ!
- Github Remote <-> Upstage Server: ์ฐ์ฃผ๋, ํ์๋์ ์ด๋ฏธ ํ๊ณ ์์!
- baseline code์์ model roberta๋ก ๋ฐ๊ฟ์ ๋๋ ค๋ณด์ ๋ถ ๊ณ์ ๊ฐ์.. ์ฐจ์์๊ฐ ์๋ง์์ ์ค๋ฅ๊ฐ ๋จ๋๊ฑฐ๊ฐ์๋ฐ ์ด๋ค๋ถ๋ถ์ ๊ณ ์ณ์ผํ ์ง ๊ฐ์ด ์์ค๋ค์;;
- ์ฝ๋๋ ์ ๊ณต๋ ์ฝ๋์์ MODEL_NAME = "klue/roberta-large" ์ด ๋ถ๋ถ๋ง ๋ฐ๊ฟจ๋๋ฐ ์ฌ์ง๊ณผ ๊ฐ์ ์ค๋ฅ๊ฐ ๋จ๋ค์ ใ ใ ๋ฒํธ ๋ฒ ์ด์ค๋ ์ ๋๋๋ฐ ๋ก๋ฒํ base๋ ์๋๋๋ผ๊ตฌ์ ใ ใ ... ์ด๊ฒ ๋ฌด์จ ๋ฌธ์ ์ธ์ง ์กฐ๊ธ ๋ ์ฒ์ฒํ ๋ฏ์ด๊ฐ๋ฉด์ ๊ณต๋ถํด์ผ๊ฒ ์ต๋๋คใ ใ
rm -rf ~/.local/share/Trash/* ์ถ์ฒ: https://askubuntu.com/questions/468721/how-can-i-empty-the-trash-using-terminal
- ALBERT
- semicolon์ ๋ฃ์ด์ผ ํ๋ ๋ง๋? '[SEP]'์ผ๋ก ๋ฃ์ด์ผ ํ๋ ์๋๋ฉด [SEP]๋ก ๋ฃ์ด์ผ ํ๋.
๋ผ๋ฒจ์ด ์ด 30๊ฐ: type ๊ฐ์ ๊ด๊ณ๋ค๋ก ๋ผ๋ฒจ์ด ๋๋๋ผ๊ณ ์.
- Special token์ ์ง์ ์ถ๊ฐํ๋ฏ์ด ๋ฑ์ผ๋ก Replaceํด์ ๋ฃ์๋๋ฐ ์ฑ๋ฅ์ด ์ข์์ง์ง ์์๋ค.
- type์ ์กฐํฉ์ผ๋ก ๋์ฌ ์ ์๋ ๊ฒ ๋ช ์๋๋ผ๊ณ ์.
- ์๋ฅผ ๋ค์ด์ subjectํ๊ณ object์ ๊ด๊ณ๊ฐ organization์ด ํด์ฒดํ ๋ ์ง์๊ฑฐ๋ ์.
- ๋ชจ๋ธ ๋ผ๋ฒจ ๊ฒฐ๊ณผ๊ฐ์ ์ชผ๊ฐค ์ ์๋๊ฐ?: ๋ผ๋ฒจ ์ชผ๊ฐ๋ ๋ฐฉ์์ ์ ๋ชจ๋ฅด๊ฒ ์. ๋นํ์ฆ, ์กฐ์ง ํด๋ฆฌ์จ ๊ด๊ณ๋ฅผ ํ์ ํด์ผ ํ์์์.
- ๋นํ ##์ฆ์ฒ๋ผ ๋๋๋ ๊ฒ ์ ์ข์ ๊ฒ ๊ฐ์์ type ๋ณ๋ก ๋ฐ๊ฟจ๋๋ฐ, ๊ทธ๋ ๊ฒ ์ ๋์ค์ง๋ ์๋๋ผ๊ณ ์.
- ๊ธฐํ๊ณ ์ ๋ช ์ฌ์ธ ๋ฏ
- ์ ๋ฒ Pstage ๋๋ Crossentropy loss์ class weights๋ฅผ ๋ถ์ฌ๋ฅผ ํ๊ฑฐ๋ ์. ๊ทธ๊ฑฐ๋ฅผ ํ์ ๋๋ ์ ํ์ ๋๋ ๋น๊ต๋ฅผ ์ ํด๋ดค๊ณ . ๊ทธ๊ฑธ ํ์ ๋ ์ฑ๋ฅ์ด ์ ๋์ค์ง๋ ์๋๋ผ. Albert ๋ชจ๋ธ์ ๋ฌธ์ ์ธ ๊ฑด์ง ์ ๋ชจ๋ฅด๊ฒ ์. Class weight๋ฅผ ํ๋ ๊ฒ ์ด๋ป๊ฒ ์๊ฐํ์๋์?
- Class weight ๋ฃ๋ ๋ฐฉ์์ด ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์๋๋ฐ. ๊ทธ๊ฑธ ์๋ํด๋ด์ผ๊ฒ ๋ค๋ ์๊ฐ์ ํ๊ณ ์์ด์. Focal loss weight ๋ฃ๋ ๊ฑฐ๋ class weight ๋ฃ๋ ๊ฑฐ๋ ๋ค๋ฅธ๊ฐ ์ถ๊ธฐ๋ ํ๊ณ .
- Trainer์ class weight์ ๋ฃ๋ ๋ฐฉ์์ ๋ชฐ๋ผ์ ์ฝ์ง์ ํ๋๋ฐ. ๊ฒฐ๊ตญ ์ฐพ์๊ฑฐ๋ ์! Trainer์์ ์์๋ฐ์์ compute_loss๋ก overwrite์ ํ๋ค.
- Focal loss์ EDAํ class weight์ผ๋ก ๋ฃ๋ ๊ฒ๋ ์ข์ ๋ฏ ํ๋ค.
ValueError: Couldn't instantiate the backend tokenizer from one of:
(1) a `tokenizers` library serialization file,
(2) a slow tokenizer instance to convert or
(3) an equivalent slow tokenizer class to instantiate and convert.
input_id, token_id, attention_mask, labels ๋์ ๋๋ฆฌ๋ก ๋์ค์์์?
- object๋ ์๋ ๋ฌธ์ฅ์ด๋ 0,1๋ก binary๋ก context๋ฅผ ๊ตฌ๋ถํ๋ ๋ฏ ํ๋ค.
- CUDA ์๋ฌ๋ low-level ์๋ฌ๋ผ์ .to_device()๋ฅผ GPU ๋์ ์ CPU๋ก ํ๋ฉด ์ข ๋ ํ์ด๋ ๋ฒจ ์๋ฌ๋ฅผ ํด๊ฒฐํ ์ ์์ต๋๋ค.