Week10 Day1 - ai-esg/our-history GitHub Wiki
ν NLP 11μ‘° Week10 Day1
λͺ©μ°¨
μΌμ
- 2021.10.05 ν
νμ
- λ¬Έμμ_T2075
- λ°λ§λ£¨μ°¬_T2078
- λ°μλ©_T2090
- μ°μμ§_T2137
- μ€μν_T2142
- μ₯λ건_T2185
- ννμΉ_T2250
νΌμ΄μΈμ
ν λ‘
- f1-score optimizationν κ²½μ° eval acc, micro f1, auprc λΉμ μμ μΌλ‘ λμ
ONGOING
- Adaptation λ¬Έμμ, μ₯λ건
- TAPT
- Domain (μλ£)
- Task (μ ν¬ λ°μ΄ν° λͺ¨λ)
- μ°μ Adaptation train μ§νμ€
- AEDA λ°λ§λ£¨μ°¬
- μ λΉν κΈ°νΈλ₯Ό 무μμλ‘ λ£κ³ νλ ¨μ ν΄ λ³΄λ μ€μ΄λ€.
- 무μμ κΈ°νΈ μμ±μ λμ΄μ°κΈ° μ νλ‘. ν ν¬λμ΄μ§μ ν¬κ² μν₯μ£Όμ§ μλ κ²μΌλ‘ 보μΈλ€.
- EDA λ°μλ©
- μ μν΄μ ꡬνν΄λ³Έ κ²°κ³Ό μ±λ₯μ΄ μ€νλ € νλ½νλ€.
- bert-baseμ roberta-large λ λ€ νλ½νλ€. 1μνμ§λ¦¬ νμ΅μμλ λ§μ°¬κ°μ§μλ€.
- Entity embedding μ€μν, μ°μμ§, ννμΉ
- Typed entity marker( punct ) μ μ©ν΄μ νμ΅μ€μ΄λ€.
μμλΈ κ²
-
roberta-large paper λ²€μΉλ§ν¬ μ±λ₯ λ΄λ configuration (μνλ)
-
f1 loss 보λ€λ focal lossλ₯Ό μ¬μ©νλ κ²μ΄ λ μ±λ₯μ΄ λμ κ² configuration (μνλ)
-
bert-base μ±λ₯ ν₯μλλ configuration (μμ§λ)
-
evaluation κΈ°μ€μ test κΈ°μ€κ³Ό μΌμΉν λ 리λ보λμ λΉμ·ν κ²°κ³Όκ° λμ΄ (micro f1)
무μμ λ ν μ μλ?
-
λ΄μΌ 12:00μ κ²°κ³Ό λ Όμ
- μλνΈμ μ΄ν΄μν¬ μ μκ² κ°λ¨ν μλ£ μ€λΉ ν΄μ.
-
μ΄ν ensemble λ Όμ
-
ensemble
- bert-base, roberta-large
- Adaptation μ μ©, λ―Έμ μ©
- AEDA, EDA μ μ©, λ―Έμ μ©
- Typed entity marker μ μ©, λ―Έμ μ©
- entity λ¬Έμ₯ κ΅¬μ± μ μ©, λ―Έμ μ©