Week14 Day4 - ai-esg/our-history GitHub Wiki
ํ NLP 11์กฐ Week14 Day4
๋ชฉ์ฐจ
์ผ์
ํ์
- ๋ฌธ์์_T2075
- ๋ฐ๋ง๋ฃจ์ฐฌ_T2078
- ๋ฐ์๋ฉ_T2090
- ์ฐ์์ง_T2137
- ์ค์ํ_T2142
- ์ฅ๋๊ฑด_T2185
- ํํ์น_T2250
์ฃผ๊ฐ ์ผ์

Ensemble ๊ด๋ จ
- Reader ์์๋ธ
- Hard voting
- koelectra๋ฅผ ์ ์ธํ๊ณ ์์๋ธ ์งํํ EM 65.8 ๋ก ์ต์ข
์ ์ถ.
- ๋จ์ผ ๋ชจ๋ธ ์ต๊ณ ์ฑ๋ฅ EM 60.
์ต์ข
์ ์ถ
- Retrieval
- bm25, ์๋ผ์คํฑ ์์น
- Reader
- Roberta-large, Roberta-large๊ธฐ๋ฐ custom model
Dense
- ํ๋ จ ์ํญ ๋๋ฆด ๋ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ์ด์ ๋ negative sample์ ์ ๋ต ๋ฌธ์๊ฐ ๋ค์ด๊ฐ๋ ๊ฒฝ์ฐ ๋๋ฌธ
- in-batch training์ผ๋ก ์๋ชป๋ ๋ฐ์ดํฐ์
๊ตฌํ์ ํผํ๋, ํ๋ จ ์ํญ๊ณผ train score๊ฐ ๋น๋กํ๋ ๊ฒ์ ํ์ธ
- ๋ ๋์ ์ฑ๋ฅ์ ์ํด์ BM25 top-k ๋ฌธ์๋ฅผ ์ด๋ป๊ฒ ํ์ฉํ๋์ง ์์๋ณผ ๊ฒ
๋ฉํ ๋ง
- ์์๋ธ์ ๋ํ๋ฅผ ์ํ ๊ธฐ๋ฒ์ผ ๋ฟ์ด๋ค.
- ์๋ผ์คํฑ ์์น๋ฅผ ๋๊ธฐ๋ ์ด๋ ค์ด ์ผ์ด๋ค. Dense๋ก ๊ทธ ์ ๋ ์ฑ๋ฅ์ด ํ๋ค๋ค.
- ๋ด๊ฐ ์ ํด๋ณด์ง ์์ ํค์๋๋ฅผ ์ตํ๊ฐ๋ ๊ฒ์ด ๋ถ์คํธ์บ ํ์์ ํฌ๊ฒ ์ป๋ ๊ฒ์ด๋ค.
- ํด๋ผ์ฐ๋, ํ๋ก ํธ์๋, db ๋ฑ์ด ๋ค์ด๊ฐ๋ฏ๋ก ์ดํ์ ๊ณผ์ ์ ๋ฆฌ๋
์ค ๋ฑ์ ์์์ผ๋ง ์งํ์ด ์ฉ์ดํ๋ค.
- ํ๋ก๊ทธ๋๋จธ์ค sql ๋ฌธ์ ๋ ๋ฌธ์ ์์ฃผ. ์ค์ ์์ ์ฟผ๋ฆฌ๋ฌธ ๋ฑ์ ์ ์ฐ๋ ๋ฐฉ๋ฒ์ ์ตํ๋์.
- ๋ง์ ๊ธฐ์
๋ค์ด ํ๋ณด์ฐจ ๋คํธ์ํน๋ฐ์ด์ ์ฐธ์ฌ. ๋ค๋ง ์ง์ง ๊ฑฐ๊ธฐ์ ๋ฝ๋๊ฑด ์๋. ๊ทธ๋ฅ ์ดํด๊ด๊ณ๊ฐ ๋ง๋ฌผ๋ ธ์ ๋ฟ?
- ์ ๋๋ก ์
๋ฌด ํ๋ก์ธ์ค๊ฐ ๊ตด๋ฌ๊ฐ์ง ์๋ ํ์ฌ์ ๊ฐ์ง ๋ง์ โ ๊ณ ์น๊ธฐ ์ด๋ ต๊ณ ๋์ค์ ๊ฒฝ๋ ฅ์ ์ดํํ๊ธฐ๊ฐ ํ๋ฌ
- ๋ฌธ์ ๊ณต์ ๊ฐ๋ฅ. ์ฒ์ฌ๋ฎ! ์ฒ์ฌ๋ฎ!