Week10 Day4 - ai-esg/our-history GitHub Wiki
- 2021.10.08 ๊ธ
- ๋ฌธ์์_T2075
- ๋ฐ๋ง๋ฃจ์ฐฌ_T2078
- ๋ฐ์๋ฉ_T2090
- ์ฐ์์ง_T2137
- ์ค์ํ_T2142
- ์ฅ๋๊ฑด_T2185
- ํํ์น_T2250
- ํ ํ๊ณ ๋ก ์ ์ถ
- ๋ฉ์ ๋ฆฌํฌํธ ์์ฑ
- ์ฝ๋ ์ ๋ฆฌ
- ๋ฐ๋ง๋ฃจ์ฐฌ
- ๋ค ๊ฐ์ด ํ๊ณ ์ถ์ ๊ฒ์ ํ๋ ๊ฒ ๊ฐ์. ์ฑ๋ฅ์ด ์ฌ๋ผ๊ฐ์ง ์์ ์์ฌ์ด ํ์๋ค๋ ์์ ๊ฒ์ผ๋ก ๋ณด์. ์คํ ๊ด๋ฆฌ, ๊ตฌํ ๋ถ๋ถ์์ ๋ถ๋ด์ ์ค์ด๊ณ ์์ด๋์ด์ ๋ ์ง์คํ ์ ์๊ฒ ๊ฐ์ ํ๋ฉด ์ข์ ๊ฒ ๊ฐ๋ค. ๊ฒฐ๊ณผ๊ฐ ์ข์์ ๋ค๊ฐ์ด ๋ง์กฑํ๋ ๋ถ์๊ธฐ!
- ๋ฌธ์์
- ํ์ ์ ์ธ ๋ถ๋ถ์์ ์ถฉ๋ถํ ์ฑ๊ณผ๊ฐ ์์์ง๋ง ์ญ์ผ๋ก ๊ทธ์ธ ๋ถ๋ถ์ ๋ํ ์ดํด? ๋ ์กฐ๊ธ ๋ถ์กฑํ ์ ์๊ฒ ๋ค ๋ผ๋ ์๊ฐ์ด ์์ด ์ฝ๋ ๋ฆฌ๋ทฐ๋ฅผ ์ข ๋ ์ ๊ฒฝ์จ์ ํด์ผ๊ฒ ๋ค๋ผ๋ ๊ฐ์ธ์ ์ธ ์๊ฐ์ด ์ข ์์ง๋ง ๋ ํ์ต๊ณผ ์ ์์ ํธ๋ ์ด๋ ์คํ ๊ด๊ณ์์์ ์ ๋ชจ๋ฅด๊ฒ ๋ค.
- ๋ฐ์๋ฉ
- 76์ . ํ์ ์ผ๋ก ๊นํ๋ธ๋ฅผ ๋ง์์ ๋ค ์ ๋๋ก ์ฌ์ฉํ๋ค. ์ฝ๋ ์ฌ์ฉ์ด ๊ทธ๋๋ก ์ ์ถ ๊ฐ๋ฅํ ์ ๋๋ก ๊น๋ํ๋ค. ๋ง์ง๋ง ์ฃผ์ฌ์๋ฅผ ๋ฏฟ์ง ๋ชปํ ๊ฒ์ด ์์ฝ๊ธฐ๋ ํ์ง๋ง ๊ทธ๋ฅ ์์ฌ์ด ์ ๋์ด๋ค. ์ค์ง์ ์ธ ์ง์์ ๋ํ ํ ์๋ ๋ถ์กฑํ๋๊ฒ ๊ฐ๋ค.
- ์ฐ์์ง
- ๊นํ์ ๋ค์ํ ๊ธฐ๋ฅ์ ์ฌ์ฉํด๋ณด๊ณ ํ๋ก์ ํธ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์งํํ๊ฒ ๊ฐ์์ ์ข์๋ค. ๊ทธ๋ฆฌ๊ณ ํ์๋ค๊ณผ์ ์ํต์ด ์ ๋๊ฒ ๊ฐ์ ๋ค์ํ ์ด์ผ๊ธฐ๋ฅผ ๋๋๊ณ ์์ด๋์ด ๊ณต์ ๋ ํ ์ ์์ด์ ๋ค์ํ ์คํ์ ํ ์ ์์ด ์ข์๋ค.
- ์ค์ํ
- ๊นํ์ ์ ๊ทน ํ์ฉํ ์ , ๊ทผ๊ฑฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์คํ์ ์งํํ ์ ์ด ์ข์๋ค. ์ ์๋ฅผ ๋ชฉ์ ์ผ๋ก ํ๋ก์ ํธ๋ฅผ ์งํํ์ง ์์์ ์ ์ ๋ค๋ฅธ ๋ถ๋ถ์์๋ ๋ง์กฑ์ค๋ฌ์ ๋ค.
- ์ฅ๋๊ฑด
- github๋ฅผ ํ์ ์ฉ๋๋ก์จ ์ฌ์ฉํ ๊ฒ์ ์ฒ์์ด์๋๋ฐ ํจ์จ์ ์ธ ์์ฌ์ํต์ ํ ์ ์์ด์ ์ข์๋ค.
- ํํ์น
- ํ์๋ถ๋ค์ ํ์ ๋ฅ๋ ฅ์ ๋ณผ ์ ์์ด์ ์ข์๊ณ , ๋ค ๊ฐ์ด ์ญํ ์ ๋๋ ์ ๋ชจ๋ธ์ ๋๋ ค๋ณธ ๊ฒ์ด ์ข์๋ค
- GITHUB ์ ๊ธฐ๋ฅ์ ๋ง์ด ํ์ฉํ ๊ฒ
- ์คํ์ฉ ์ฝ๋๊ฐ ๋ชจ๋ ํ์์ ๋ํด ์ผ์น๋์ด ์์ด์, ๊ฐ๋ฐ๊ณผ ์คํ์ด ์ ๋ถ๋ฆฌ๋์์
- KLUE paper๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์คํํ์๋ ๊ฒ
- ํ ๋ก ๊ฒ์ํ์ ์๊ฐ์ ๊ณต์ ํ์ง ๋ชปํ ์
- ๊ธฐ๋ฐํ ์์ด๋์ด๋ ๋ฐ๊ฒฌ ๋ฑ์ด ์๋ค๋ฉด ํ ๋ก ๊ฒ์ํ์ ํตํด ๋ ๋ง์ ์ฌ๋๊ณผ ์๊ฒฌ์ ์ฃผ๊ณ ๋ฐ์์ผ๊ฒ ๋ค.
- ์ฝ๋ ๋ฆฌ๋ทฐ
- ํ์ต์ ์ธ ์ธก๋ฉด์์ ๋ค๊ฐ์ด ์ฝ๋ ๋ฆฌ๋ทฐ๋ฅผ ์ข ๋ ์ด์ฌํ ํ๋ฉด ์ข์ ๊ฒ์ด๋ค.
- task ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌํ ์ ์๋ ๊ธฐ์ ์ ์ง์ ์ฐพ์ง ๋ชปํ ์
- AEDA, TAPT์ ๊ฐ์ ๊ธฐ๋ฒ๋ค์ ์ค์ค๋ก ์ฐพ์ ์ ์๋๋ก ํ๋ฉด ์ข์ ๊ฒ ๊ฐ๋ค.
- ๋ค์ํ ๋ชจ๋์ ์ฌ์ฉ
- ์ปค์คํ ์๋
- ์ด๋ก ์ ์ธ ์ ๊ทผ
- ์ด๊ธฐ์ Model, Hyper parameter ๊ณ ์
- klue/bert-base (62.32, 68.51)/(EM, ROUGE) ์ด ์ธํ ์ผ๋ก ๊ณ ์ ํ๊ณ ์์ํ๋ฉด ์ด๋จ๊น?
- ํ๋์ ๋์ค์. hyper parameter ์ต์ ํ ํด ์ฌ์ฉํ๊ธฐ.
- ๋งค์ผ๋งค์ผ 10๋ฒ ์ ์ถ ํ๊ธฐ
- ๋ฐ๋ง๋ฃจ์ฐฌ
- ํ๋ก์ ํธ ์ด๊ธฐ์ ๋ชจ๋ธ ์ดํด๋ฅผ ๋ ๊น์ด ํ๋ค๋ฉด ์ฃผ๋์ ์ธ ์คํ์ด ๊ฐ๋ฅํ์ ๊ฒ ๊ฐ๋ค.
- ๋ฌธ์์
- ๊ฒฝํ์ด ์ ๋ง ํฐ ๋ฌด๊ธฐ๋ผ๋๊ฑฐ ํนํ AI ๋ถ์ผ ์ชฝ์์... ๊ทธ๋ฌ๋๊น ๊ณต๋ถํ์ ๊ณต๋ถ๊ณต๋ถ
- ๋ฐ์๋ฉ
- ์ด์์ ์ผ๋ก ์ณ๋ค๊ณ ํด์ ๊ธฐ๊ณํ์ต์ด ์ด์์ ์ผ๋ก ๋๋ ๊ฑด ์๋๋ค. ๊ฐ์ธ ๊ด๋ฆฌ์ ๊ฐ์ธ ํ์ต์ ๋ ์ ๊ฒฝ์จ์ผ๊ฒ ๋ค.
- ์ฐ์์ง
- ๋ชจ๋ธ์ ๋จผ์ ๊น์ด์๊ฒ ๊ณต๋ถํ์ง ์๊ณ ๋ํ๋ฅผ ์งํํด์ ์กฐ๊ธ ์์ฌ์ ๋ค. ํ์ง๋ง ํ ํฌ๋์ด์ ์ NLP Task๊ฐ ์ด๋ค์์ผ๋ก ์งํ๋๋์ง์ ๋ํ ๊ฐ์ ์ก์๊ฒ ๊ฐ๋ค.
- ์ค์ํ
- ํ ํฌ๋์ด์ ์ ๋ชจ๋ธ์ ๊ธฐ๋ณธ์ ์ธ ์๋ ๋ฐฉ์์ ๋ํ ๊ณต๋ถ๋ฅผ ํ์ง ๋ชปํ ๊ฒ์ด ์์ฌ์ ์ด์, ์ด๋ค ์์ผ๋ก ํ์ต์ด ๋๊ณ ๊ฒฐ๊ณผ๊ฐ ์ ๋ฌ๋๊ณ special token์ด ์ฌ์ฉ๋๋ ๊ฒ์ธ์ง ๊ณต๋ถํด์ผ ํ ๊ฒ ๊ฐ๋ค.
- ์ฅ๋๊ฑด
- huggingface๋ฅผ ์ฌ์ฉํ๋ ๋ฐ ์ต์ํด์ ธ์ผ ํ ํ์์ฑ์ ๋๊ผ๋ค. ๊ธฐ๋ณธ์ ์ธ ๊ฒ์ ๋ชฐ๋ผ์ ์๊ฐ์ ์๋ชจํ๋ ์ํฉ์ ์ค์ด๊ธฐ ์ํด ๊ธฐ๋ณธ์ ์ธ ๋ด์ฉ ๊ณต๋ถ๋ฅผ ์ํํ ํ์ง ๋ง์์ผ ๊ฒ ๋ค.
- ํํ์น
- ๋ํ ๊ธฐ๊ฐ๋์ ๊นํ, cliํ๊ฒฝ์ ์ต์ํด์ง์ง ๋ชปํ๋ ๊ฒ์ด ์ ๋ง ์์ฌ์๋ ๊ฒ ๊ฐ๋ค. ๋ํ ์ ๋ฒ ์คํ ์ด์ง์ ๋ค๋ฅด๊ฒ ์ ์ฒด์ ์ธ ์ฝ๋ ์ดํด๊ฐ ๋ถ์กฑํด์ ์ ๋ฐ๋ผ๊ฐ์ง ๋ชปํ๋ ๊ฒ ๊ฐ๋ค. ์ฌ๋ฌ๋ชจ๋ก ์์ฌ์์ด ๋ง์ ๋ํ์๋ ๊ฒ ๊ฐ๋ค
- [1. ํ๋ก์ ํธ ๊ฐ์]
- [2. ํ๋ก์ ํธ ํ ๊ตฌ์ฑ ๋ฐ ์ญํ ]
- [3. ์ํํ ๋ฏธ๋ํ๋ก์ ํธ]
- [4. ์ต์ข ํ๋ก์ ํธ ๊ฒฐ๊ณผ]
- [5. ์์ฒด ํ๊ฐ ์๊ฒฌ]
- Relation Extraction task
- ๋ฌธ์ฅ ์ ๋ ๋จ์ด์ ๊ด๊ณ๋ฅผ ์ถ๋ก ํ๋ ๋ชจ๋ธ ํ์ต.
- ๋ชจ๋ธ์ ๋ ๋จ์ด์ ๋ฌธ์ฅ์ ์ ๋ ฅ์ผ๋ก ๋ฐ๊ณ , ์ง์ ๋ ๋ ๋จ์ด์ ๊ด๊ณ๋ฅผ 30๊ฐ์ง class ์ค ํ๋๋ก ์์ธกํ๋ค.
- ํด๋น task์์ ์ถ๊ฐ์ ์ธ ์ ์ฒ๋ฆฌ์ ํ
์คํธ์
์ธ์ด๋ชจ๋ธ ์ฌ์ ํ์ต, ์์๋ธ์ ํตํด KLUE ๋ฒค์น๋งํฌ* ๋๋น ์ฝ 4%์ micro f1-score ํฅ์์ ํ์ธํ์๋ค.
- *(Park, Sungjoon, et al. "KLUE: Korean Language Understanding Evaluation." arXiv preprint arXiv:2105.09680 (2021))
- ๋ฐ๋ง๋ฃจ์ฐฌ (ํ์ฅ) : environment, AEDA
- ๋ฌธ์์ (ํ์) : ๋ฐ์ดํฐ ๋ถ์, model modularize, TATP
- ๋ฐ์๋ฉ (ํ์) : dataset, EDA
- ์ฐ์์ง (ํ์) : model modularize, Random Oversampling, Train Dataset ๊ตฌ์กฐ ๋ง๋ค๊ธฐ
- ์ค์ํ (ํ์) : dataset, Typed Entity Marker(punct), Entity Swap Augmentation
- ์ฅ๋๊ฑด (ํ์) : environment, TATP
- ํํ์น (ํ์) : dataset, ์ ๋ ฅ๋ฐ์ดํฐ ๊ตฌ์กฐ ๋ง๋ค๊ธฐ
-
Gantt Chart
-
๋ถ์
- ํ์์ ๋ถ์
-
subject_entity
type์per
,org
๋ก 2๊ฐ์ง๋ก ๋ถ๋ฅ๋๋ค. -
relation
๋subject_entity
์ entity์์ํด ๋จ์ฒด ๋๋ ์ฌ๋์ผ๋ก ์์ํ๋ค- ๋จ, ๋ฐ์ดํฐ์์ ์์ธ๊ฐ ์กด์ฌ
- ์๋ชป ํ๊ธฐ๋ ๊ฒฝ์ฐ
- ์๋ ์๋ ๋ฑ์ org Label ์ด per ์ธ ๊ฒฝ์ฐ
- ๋์๋ช
๋ฑ์ ์ง๋ช
์ด subject_entity ๋ก ๋์
subject_entity
๊ฐ ์๋ชป ๋์จ ๊ฒฝ์ฐ
- ์๋ชป ํ๊ธฐ๋ ๊ฒฝ์ฐ
- ๋ค๋ฅธ ์์ธ ์ฌํญ์ ํ์ธํ์ง ๋ชปํจ.
- ๋จ, ๋ฐ์ดํฐ์์ ์์ธ๊ฐ ์กด์ฌ
-
- ์ ๊ทผ ๋ฐฉ๋ฒ, ๋ฐ์
- ๋ ผ๋ฌธ์์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ธ ๋ชจ๋ธ์ ์ ์ .
- ๊ธฐ์กด์ Pretraining๊ณผ ์ต๋ํ ๋น์ทํ ์ ๋ ฅ์ ์ฃผ๊ธฐ ์ํ ์ ๋ ฅ ํํ ๋ณํ
- ๋ฐ์ดํฐ ๋ถ๊ท ํ ํด๊ฒฐ ๋ฐ ์ฆ๊ฐ์ ์ํ augmentation
- ํ์์ ๋ถ์
-
๋ชจ๋ธ ์ ์
- ์ ๊ณต๋ ๋ชจ๋ธ ์ค ์ ๊ทผ์ด ์ฝ๊ณ , ๊ด๋ จ ๋ ผ๋ฌธ์์ ์ฑ๋ฅ์ด ์ข์๋ ๋ชจ๋ธ์ ์ ์ ํ์๋ค.
- KLUE ๋ฒค์น๋งํฌ์์ ์ ์ํ ํ๋ผ๋ฏธํฐ๋ค์ ํตํด ๊ฒฐ๊ณผ๋ฅผ ๊ตฌํํ์๋ค.
-
์ ์ฉ ์ฌํญ
-
Typed Entity Marker (punct)
- An Improved Baseline for Sentence-level Relation Extraction ๋ ผ๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ์งํ
- data๋ก ์ฃผ์ด์ง๋ sentence์ entity์ type๊ณผ ํจ๊ป entity marker๋ฅผ ์ถ๊ฐํ๋ marker๋ก special token๋์ ๋ฌธ์ฅ๋ถํธ๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด๋ค.
- ์ฑ๋ฅ์ด ํฅ์๋์๋ค. entity type๊ณผ ํจ๊ป entity๋ฅผ markํ์ฌ ๋ชจ๋ธ์๊ฒ ๋ ๋ง์ ์ ๋ณด๋ฅผ ์ ๊ณตํด์ค์ผ๋ก์จ ์ฑ๋ฅ์ด ํฅ์๋ ๊ฒ์ผ๋ก ์ฌ๊ฒจ์ง๋ค.
-
Adaptation
-
๋ฐฉ๋ฒ ์ค๋ช : pretrain ๋ ๋ชจ๋ธ(ex bert๋ฑ)์ Masked language modeling์ ํตํด ์ฌ์ ํ์ต ์ํจ ํ Finetuning ํ๋ ๋ฐฉ๋ฒ์ด๋ค.
-
์ ์ฉ ์ฌ์ : Domain ๋๋ Task์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ํ๋ฒ ๋ ํ์ต ์ํค๋ ๊ฒ์ด ๋น์ฐํ ๋ ๊ฐ ๋จ์ด๊ฐ ๊ด๋ จ๋๊ฐ ๋์ ๊ฒ์ด๋ผ ์๊ฐํ๋ค. (์ฐธ๊ณ Donโt Stop Pretraining: Adapt Language Models to Domains and Tasks)
-
์ ์ฉ ๋ฐฉ์
- ์ฐ์ ํด๋น Task์์๋ Domain์ ํ์ ํ ์ ์์ด์ DATP๋ ์ฌ์ฉ์ด ํ๋ค ๊ฒ์ด๋ผ ํ๋จํ์๋ค.
- Dataset์ ํตํ TATP(Task-Adaptive PreTraining )์ ์งํ
-
์ ์ฉ ๊ฒฐ๊ณผ
- Train set ์ ํตํ ์งํ
- Submission F1 score๊ฐ ์คํ๋ ค ๋จ์ด์ง
- Train + Test set์ ํตํ ์งํ
- Submission F1 score๊ฐ ์ฆ๊ฐ
- Train set ์ ํตํ ์งํ
-
-
EDA
- ๊ธฐ์กด์ EDA์์๋ ๋์์ด๋ฅผ ๋ฃ๋ ๋ฐฉ์์ผ๋ก ํ์ต ๋ฐ์ดํฐ๋ฅผ ํ๋ณดํ์๋ค. ์ด์ ์ ์ฌํ๊ฒ ๋์์ด๋ ์๋๋๋ผ๋
per
,dat
,org
,loc
์ type์ ๋ํดsubject entity
์object entity
์ ๋จ์ด๋ฅผ ๋์ฒดํ๋ค. - ์ฑ๋ฅ์ ์คํ๋ ค ํ๋ฝํ๋ค. ์๋ฌด๋๋ ๋ฌธ์ฅ ๊ตฌ์กฐ๊ฐ ์ฃผ์ ๋จ์ด๋ฅผ ์ ์ธํ๊ณ ๋ ๋์ผํด์ ์๊ธฐ๋ ๊ณผ์ ํฉ ๋ฌธ์ ๋ก ๋ณด์ธ๋ค. ํนํ ์๋ ๋ผ๋ฒจ์ด ์ ์๋ค๋ฉด ์์ฑ๋ ๋์ผ ๊ตฌ์กฐ์ ๋ฌธ์ฅ์ด ๋ง๊ธฐ ๋๋ฌธ์ ํด๋น ๋ผ๋ฒจ์ ๋ ์๊ฒฉํ๊ฒ ๋ฐ์ง๋ ๊ฒฝํฅ์ฑ์ ๋ณด์ด๊ฒ ๋์ด ์คํ๋ ค ์ ์๊ฐ ํ๋ฝํ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
- ๊ธฐ์กด์ EDA์์๋ ๋์์ด๋ฅผ ๋ฃ๋ ๋ฐฉ์์ผ๋ก ํ์ต ๋ฐ์ดํฐ๋ฅผ ํ๋ณดํ์๋ค. ์ด์ ์ ์ฌํ๊ฒ ๋์์ด๋ ์๋๋๋ผ๋
-
AEDA
- ์์์ ๋ฌธ์ฅ๋ถํธ๋ฅผ ์ ๋ ฅ ๋ฌธ์ฅ์ ๋จ์ด ์ฌ์ด์ ๋ฌด์์๋ก ์ฝ์ ํ์๋ค.
- ๋ฌธ์ฅ๋ถํธ : (
,
.
;
:
?
!
) - ์ด ์ฝ์ ๊ฐ์ : ์๋ณธ ๋ฌธ์ฅ์ ๋จ์ด ์ ๋๋น 0%(๋ฏธ์ ์ฉ๊ณผ ๋์ผ) ,30%, 100%๋ก ์คํํ๋ค.
- ๊ฒฐ๊ณผ : ์ ์๋ฏธํ ์ฐจ์ด๊ฐ ๋ฐ์ํ์ง ์์๋ค.
- ๋ ผ๋ฌธ ๊ฒฐ๊ณผ์ ์คํ ๊ฒฐ๊ณผ๋ฅผ ๋ณผ ๋, ๋ ์ ์ ๋ฐ์ดํฐ์ ์ ๋ํด ํจ๊ณผ ์๋ ๋ฐฉ๋ฒ์ผ๋ก ๋ณด์.
-
Entity Swap Augmentation
- object entity๋ฅผ subject entity๋ก subject entity๋ฅผ object entity๋ก ๋ฐ๊พธ์ด๋ 30๊ฐ์ label ์ค ํด๋นํ๋ label์ด ์๋ data๋ค์ ๋ํด์๋ง entity swap์ ์งํํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋๋ฆฌ๋ ๋ฐฉ๋ฒ์ด๋ค.
- ๋ฐ์ดํฐ๊ฐ ์๋์ ์ผ๋ก ๋ง์ label์ ๋ํด์ ์งํํ ๊ฒฝ์ฐ ๋ฐ์ดํฐ ๋ถ๊ท ํ์ด ๋ ์ฌํด์ง ๊ฒ์ด๋ฏ๋ก ๋ฐ์ดํฐ๊ฐ ์๋์ ์ผ๋ก ๋ถ์กฑํ label๋ค์ ๋ํด์๋ง ์งํํ๋ค.
-
Random OverSampling
- ์๊ฐ ์ ์ label์ ๋ํด์ ๋ฐ์ดํฐ๋ฅผ ์ค๋ณต์ผ๋ก ๋ฃ์ด ๋ฐ์ดํฐ ๋ถ๊ท ํ์ ๊ทน๋ณตํ๋ ค ํ๋ค.
- ์ฑ๋ฅ์ ์คํ๋ ค ํ๋ฝํ๋ค. ๋ฐ์ดํฐ๊ฐ ์ ์ ๋ผ๋ฒจ์ด ์ค๋ณต์ด ๋ง์ด ๋๋ฉฐ ํด๋น ๋ฐ์ดํฐ์๋ง overfitting ๋๋ ๊ฒ์ด ์๋๊ฐ๋ผ๋ ์๊ฐ์ ํ๋ค.
-
train ๋ฐ์ดํฐ ๊ตฌ์กฐ ๋ง๋ค๊ธฐ
- BERT๋ Pretrainingํ ๋ 2๊ฐ์ ๋ฌธ์ฅ์ ๋ํ ๊ด๊ณ๋ฅผ
[CLS]
ํ ํฐ์ ํตํด ์ถ๋ก ํ๋ ๋ฐฉ์์ด๋ฏ๋ก, ์ด๋ฒ Relation Extraction task์์๋[CLS] original Sentence [SEP] ์ด ๋ฌธ์ฅ์์ {Subject Entity}์ {Object Entity}์์ ๊ด๊ณ๋ ๋ฌด์์ผ๊น? [SEP]
์ ๊ฐ์ ๊ตฌ์กฐ๋ก Data๋ฅผ ๊ตฌ์ฑํ์ฌ ์คํ์ ์งํํ์๋ค. - BERT๋ Pretrainingํ ๋ 2๊ฐ์ ๋ฌธ์ฅ์ ๋ํ ๊ด๊ณ๋ฅผ
[CLS]
ํ ํฐ์ ํตํด ์ถ๋ก ํ๋ ๋ฐฉ์์ด๋ฏ๋ก, ์ด๋ฒ Relation Extraction task์์๋[CLS] {Subject Entity} [SEP] {Object Entity} [SEP] ๊ด๊ณ [SEP] ์ ๋ณด Sentence [SEP]
์ ๊ฐ์ ๊ตฌ์กฐ๋ก Data๋ฅผ ๊ตฌ์ฑํด์ ๊ด๊ณ์ clsํ ํฐ์ด attention์ ํ์ตํ๋๋ก ์คํ์ ์งํํ์๋ค.
- BERT๋ Pretrainingํ ๋ 2๊ฐ์ ๋ฌธ์ฅ์ ๋ํ ๊ด๊ณ๋ฅผ
-
hyperparameter ์คํ์ ๊ฒฐ๊ณผ ์ ์
-
- ์ฑ๋ฅ ํฅ์์ ๋์์ด ๋์๋ ์ ์ฉ
- Typed Entity Marker (punct), TAPT, Entity Swap Augmentation, train ๋ฐ์ดํฐ ๊ตฌ์กฐ ๋ง๋ค๊ธฐ
- soft voting ensemble (best model์ ๋ํด 1.2๋ฐฐ ๊ฐ์ค์น ๋ฐ์)
- ์ต์ข
๋ชจ๋ธ (์ดํ ๋ชจ๋ธ ensemble)
- 72.710 (TAPT+ added data + entity marker, tokenization modify)
- 73.950 (TAPT+ entity marker, tokenization modify)
- 74.034 (added data + entity marker + tokenization modify + k-fold)
- 72.991 (entity marker + tokenization modify)
- 70.724 (TAPT (epoch 30)+ added data + entity marker, tokenization modify)
- ์ต์ข
์ ์
- Public micro_f1 score : 75.962
- Private micro_f1 score : 73.794
-
์ํ ์
- ๊นํ๋ธ ์ฌ์ฉ์ด ๋ง์กฑ์ค๋ฌ์ ๋ค. -> ํ๋ก์ ํธ ๊ด๋ฆฌ๊ฐ ๋๋ ๋๋์ด์๋ค.
- task๊ด๋ จ paper๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์คํ์ ๋ถํ ์งํํ ๊ฒ.
-
์์ฌ์ ๋ ์ ๋ค
- ์คํ ๊ด๋ฆฌ ์ข ๋ถํธํ์ (์ด๋ฆ ์ง๊ธฐ, wandb์์ ๋ด ๋ชจ๋ธ ์ฐพ๊ธฐ)
- arg ๊ฐ ๋๋ฌด ๋ง์์ ์คํ๋ ค ํ๋ค์์..
- ๋ค์์๋ <๊น์บ ํผ> 1, 2, 3, 4, 5 <์ด๋ถ์บ > 1,2,3,4 ๋ฑ์ผ๋ก ์์ฑํด๋ณด์.
- ๋ชจ๋ธ์ ๋ถํ ํ์ฌ Task๋ฅผ ๋๋๋ ๋ฐฉ๋ฒ์ ๊ณ ๋ คํ์์ผ๋ ์ค์ ์ ์ฉํ์ง ๋ชปํ ์ ์ด ์์ฝ๋ค.
- ์๊ฐํ Task ๋ถํ ์ ๋ฐ์ดํฐ์
subject_entity
๊ฐ 2๊ฐ์ง์ด๋ฉฐno_relation
,'org','per' label์ ๋น์จ์ด ๋งค์ฐ ๋น์ทํ์ฌ 3๊ฐ์ง๋ก ๋ถ๋ฅ ํ 'org','per'์ ๊ฐ์ Task๋ฅผ ํ๋ฒ ๋ ์งํํ๋ ๊ฒ์ ์๊ฐํด ๋ด
- ์๊ฐํ Task ๋ถํ ์ ๋ฐ์ดํฐ์
- ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌํ ์ ์๋ ๋ฐฉ๋ฒ(๋ ผ๋ฌธ)์ ์ง์ ์ฐพ์ง ๋ชปํ ์ .
- tokenizing๋ถํฐ ์ปค์คํ ๋ชจ๋ธ ์์ฑํ๊ธฐ.
- BERT๋ชจ๋ธ ์์ ์ธต์ ๋ ์์์ ์คํํด๋ณด์ง ๋ชปํ๊ฒ.
- wandb๋ฅผ ์ข ๋ ์ฒด๊ณ์ , ์ค์ฉ์ ์ผ๋ก ์ฌ์ฉํ์ง ๋ชปํ ์ .
- hyperparameter ์ต์ ํ ํด์ ์ฌ์ฉํด๋ณด์ง ๋ชปํ ์ .
- ์คํ ๊ด๋ฆฌ ์ข ๋ถํธํ์ (์ด๋ฆ ์ง๊ธฐ, wandb์์ ๋ด ๋ชจ๋ธ ์ฐพ๊ธฐ)