Week10 Day3 - ai-esg/our-history GitHub Wiki
ํ NLP 11์กฐ Week10 Day3
๋ชฉ์ฐจ
์ผ์
- 2021.10.07 ๋ชฉ
ํ์
- ๋ฌธ์์_T2075
- ๋ฐ๋ง๋ฃจ์ฐฌ_T2078
- ๋ฐ์๋ฉ_T2090
- ์ฐ์์ง_T2137
- ์ค์ํ_T2142
- ์ฅ๋๊ฑด_T2185
- ํํ์น_T2250
ํผ์ด์ธ์
์ต์ข ๋ชจ๋ธ ์ ์
1๋ฑ (75.796)
- 5๊ฐ ๋ชจ๋ธ
- 72.710 (TAPT+ added data + entity marker, tokenization modify)
- 73.950 (TAPT + entity marker, tokenization modify)
- 74.034 (added data + entity marker + tokenization modify k-fold 5)
- 72.991 (entity marker + tokenization modify)
- 70.724 (TAPT epoch 30 + added data + entity marker, tokenization modify)
2๋ฑ (75.607)
- 4๊ฐ ๋ชจ๋ธ
- 72.710 (TAPT+ added data + entity marker, tokenization modify)
- 73.950 (TAPT + entity marker, tokenization modify)
- 74.034 (added data + entity embed + tokenization modify k-fold 5)
- 72.991 (entity embed + tokenization modify)
3๋ฑ (75.590)
- 4๊ฐ ๋ชจ๋ธ
- 72.710 (TAPT+ added data + entity marker, tokenization modify)
- 73.950 (TAPT+ entity marker, tokenization modify)
- 73.124 (added data + entity embed + tokenization modify)
- 72.991 (entity embed + tokenization modify)
์๋ก์ด ์์ด๋์ด (2ํ ๋จ์)
์๋ ์๋ฃ
- 1,2,3 ๋ฑ ๋ฐ์ดํฐ ํฉ์น๊ธฐ
- ๊ฒฐ๊ณผ 1๋ฑ๊ณผ ๋์ผ
- k-fold์ ๊ฐ์ค์น (1๋ฑ ๋ชจ๋ธ์์)
- 1.2 ์ ๋ k-fold
- ๊ฒฐ๊ณผ 75.962, 82.359
- ์ฑ๋ฅ ๋งํผ ๊ฐ์ค์น (1๋ฑ ๋ชจ๋ธ ๊ธฐ์ค์์)
- ๋ฅ๋ ฅ๋งํผ ์ค๋ค
- ๊ฐ ํ๋ฅ ์ ์ ๊ณฑํฉ? ๋ง์ฐฌ๊ฐ์ง๋ก ํ๋ค์ด ๋ณด์ธ๋ค.
- ๋ฉํ ๋ ์์ด๋์ด
- ํ๋ ๋ณดํ (๋ฝ๋ก) : ํ๋ฅ ๊ฐ ์ ์ถ์ ๊ฐ์ด ํด์ผ ํด์ ์ด๋ ค์ธ๋ฏ ํ๋ค. (์์๋ก ๊ฐ์ 1/nํ๋ฅ ์ด๋ผ ํ ์๋ ์๊ฒ ์ง๋ง)
- eval๋น๊ต๋ฅผ ํตํ ์ ํ
- ์ ๋ถ ์ํํธ ๋ณดํ
- ๋จ์ผ๋ชจ๋ธ
ํ๋กํ ์์ด์ฝ ์ด๋ป๊ฒ ํต์ผํ์ง!
- ์ ์ทจ์ ๊ฐ์๊ฑฐ?
๋ฉํ ๋ง
- ๋ง์ง๋ง ๋ ๋ฌด์์ ํ ์ง ๊ณํ์ ์ธ์ฐ๋ ๊ฒ์ด ์ค์ํ๋ค
- ์์๋ธ ์ฝ๋ ์ ๋จ๊ฒจ๋๋ฉด ์์ผ๋ก๋ ๋ง์ด ์!
- ๋ง์ง๋ง์ ํ๋ผ๋ฏธํฐ ํ๋ ํด์ ์ฌ์ฉํ๋๊ฒ๋ ์ข๋ค!
- ์ ์ ๋๋ฌธ์ ๊ฐ๊ฐ์ธ์ ๊ณต๋ถ๋ฅผ ํฌ๊ธฐํ์ง ๋ง ๊ฒ!
- ์ ์์ ๊ธฐ์ฌํ๋๊ฐ?
- ์ฑ์ฅ์ ๊ธฐ์ฌํ๋๊ฐ?
- MRC์์๋ ์ฒ์๋ถํฐ ์ฝ๋๋ฅผ ์ง ํ์ด ์ฑ์ ์ด ์ข์๋ค๊ณ ํ๋ค์
- baseline์ ์ดํด์ ์ฉ๋๋ก๋ง ์ฌ์ฉํ๊ธฐ
- ํธ์นญ ๋ฉํ ๋ ์ฌ์ฉํ์ง ๋ง ๊ฒ!
์ผ์ ์กฐ์จ
- 22์ผ ๊ธ์์ผ๋ก ๊ทธ ์ฃผ ์ผ์ ์กฐ์จ ๊ฐ๋ฅํ์ง
์์
- relu + max pooling ์์์ ๊ฐ์์ ๊ณผ ์ด์ ๋ณด์ด๊ธฐ
- 2D-Conv ์ผ๋ก 2D Avg pooling ๋ณด์ด๊ธฐ
- sin/cos ์ ์ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ์์ง ๋ณด์ฌ์ฃผ๊ธฐ
๊ณต์ง
- ๋ฉ์
๋ฆฌํฌํธ
- ๋๋ฌด ๋ถํ๋ฆฌ๊ธฐ ๊ธ์ง(๋๋ฌด ๋ํ ์ผํ ๋ถ๋ถ)
- ํผ๋๋ฐฑ์ ๋ฐ๊ณ ์ ํ๋ ๊ฒ์ ์ผ๋ํ๊ณ ์์ฑํ๋๊ฒ์ด ๋ ์ข์๋ฏ
- ๋ฉํ ๋ง ๋ณด๊ฒ๋๋ค
- ์๊ฐ ๋๋ฌด ๋ญ๋นํ์ง ๋ง ๊ฒ
- ์ฝ๋ ์ ์ถ
- ์ฝ๋ ํผ๋๋ฐฑ์ ๋ฐ๊ณ ์ถ์ ๋ถ๋ถ์ ์๋ถ๋ถ์ ์์ฑ ์๋ง
๋ฉ์ ๋ฆฌํฌํธ
๋ชฉ์ฐจ
- [1. ํ๋ก์ ํธ ๊ฐ์ (์ฌ๊ธฐ๋ฅผ ์ด์ฌํ ์ค์ด๊ธฐ)]
- [2. ํ๋ก์ ํธ ํ ๊ตฌ์ฑ ๋ฐ ์ญํ ]
- [3. ํ๋ก์ ํธ ์ํ์ ์ฐจ ๋ฐ ๋ฐฉ๋ฒ]
- [4. ํ๋ก์ ํธ ์ํ ๊ฒฐ๊ณผ]
- [5. ์์ฒด ํ๊ฐ ์๊ฒฌ]
1. ํ๋ก์ ํธ ๊ฐ์ (์ฌ๊ธฐ๋ฅผ ์ด์ฌํ ์ค์ด๊ธฐ)
- ์ด๋ค ํ๋ก์ ํธ์ด๋ฉฐ ์ด๋ค task๋ฅผ ์ํํ๋๊ฐ?
- ํ์ค์ ๋ ์ต์ข ๊ฒฐ๊ณผ
2. ํ๋ก์ ํธ ํ ๊ตฌ์ฑ ๋ฐ ์ญํ
- ์ฐธ์ฌํ ๋ถ๋ถ์ ๋ํ ๋ช ์
3. ํ๋ก์ ํธ ์ํ์ ์ฐจ ๋ฐ ๋ฐฉ๋ฒ
- ๋ถ์
- ์ ๊ทผ ๋ฐฉ๋ฒ, ๋ฐ์
- ๋ ผ๋ฌธ์์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ธ ๋ชจ๋ธ์ ์ ์ .
- ๊ธฐ์กด์ Pretraining๊ณผ ์ต๋ํ ๋น์ทํ ์ ๋ ฅ์ ์ฃผ๊ธฐ ์ํ ์ ๋ ฅ ํํ ๋ณํ
- ๋ฐ์ดํฐ ์์ฑ์ ์ํด ๋์ผ type์ ๋ค๋ฅธ ๋จ์ด ๋ฃ๊ธฐ
- ๋ชฉํ subject/object์ type์ ๋ํ๋ด๋ ํ ํฐ์ ๋ฃ๊ธฐ
- ๋ ๋ญ๊ฐ ์์๊น์?
- ์ ๊ทผ ๋ฐฉ๋ฒ, ๋ฐ์
- ๋ชจ๋ธ ์ ์
- ํ๊ฐ ๊ฐ์
- ์ ์ฉ ์ฌํญ
- ๊ฐ์ ์๋ํ ๋ฐฉ๋ฒ๋ค ์ค๋ช
4. ํ๋ก์ ํธ ์ํ ๊ฒฐ๊ณผ
- ์ฑ๋ฅ ํฅ์์ ๋์์ด ๋์๋ ์ ์ฉ
- ์ต์ข ๋ชจ๋ธ
- ์ต์ข ์ ์
5. ์์ฒด ํ๊ฐ ์๊ฒฌ
- ์ํ ์
- ๊นํ๋ธ ์ฌ์ฉ์ด ๋ง์กฑ์ค๋ฌ์ ๋ค. -> ํ๋ก์ ํธ ๊ด๋ฆฌ๊ฐ ๋๋ ๋๋์ด์๋ค.
- task๊ด๋ จ paper๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์คํ์ ๋ถํ ์งํํ ๊ฒ.
- ์๋ ํ์ผ๋ ์ ๋์ง ์์๋ ๊ฒ๋ค
- ์์ฌ์ด ์ ๊ณผ ์ค๋ณต?
- oversampling
- ์์ฌ์ ๋ ์ ๋ค
- ์คํ ๊ด๋ฆฌ ์ข ๋ถํธํ์ (์ด๋ฆ ์ง๊ธฐ, wandb์์ ๋ด ๋ชจ๋ธ ์ฐพ๊ธฐ)
- arg ๊ฐ ๋๋ฌด ๋ง์์ ์คํ๋ ค ํ๋ค์์..
- ๋ค์์๋ ๋ง๋ฃจ์ฐฌ 1, 2, 3, 4, 5 ์๋ฉ 1,2,3,4 ๋ฑ์ผ๋ก ์์ฑํด๋ณด์.
- ๋ชจ๋ธ ๋ถํ ๋ชปํด๋ณธ ๊ฒ
- embedding layer์ถ๊ฐ ๋ชป ํด๋ณธ ๊ฒ
- tokenizing๋ถํฐ ์ปค์คํ ๋ชจ๋ธ ์์ฑํ๊ธฐ
- BERT๋ชจ๋ธ ์์ ์ธต์ ๋ ์์์ ์คํํด๋ณด์ง ๋ชปํ๊ฒ
- wandb๋ฅผ ์ข ๋ ์ ์ฌ์ฉํ ์์์ง ์์์๊น
- ์คํ ๊ด๋ฆฌ ์ข ๋ถํธํ์ (์ด๋ฆ ์ง๊ธฐ, wandb์์ ๋ด ๋ชจ๋ธ ์ฐพ๊ธฐ)