Week12 Day1 - ai-esg/our-history GitHub Wiki
ํ NLP 11์กฐ Week12 Day1
๋ชฉ์ฐจ
์ผ์
- 2021.10.18 ์
ํ์
- ๋ฌธ์์_T2075
- ๋ฐ๋ง๋ฃจ์ฐฌ_T2078
- ๋ฐ์๋ฉ_T2090
- ์ฐ์์ง_T2137
- ์ค์ํ_T2142
- ์ฅ๋๊ฑด_T2185
- ํํ์น_T2250
์ฃผ๊ฐ ์ผ์
ํผ์ด์ธ์
์ถ๊ฐ ๊ฒฐ์ ์ฌํญ
- ์ฝ๋ ์ดํด๋ฅผ ์ํด PR์ 6๋ช approve๋ฅผ ๊ธฐ๋ํด๋ณด์.
- ํผ์ด์ธ์ ์์ ์ฝ๋๋ฆฌ๋ทฐ๋ฅผ ํด ๋ณด์ (์ต๋ํ ๋น ๋ฅด๊ฒ)
ํ ๋ถ๋ฐฐ
-
Reader
- ์ฐ์์ง
- ์ค์ํ
- ํํ์น
-
Retrieval
- ๋ฌธ์์
- ์ฅ๋๊ฑด
- ๋ฐ์๋ฉ
- ๋ฐ๋ง๋ฃจ์ฐฌ
Read
- reader.py๋ก class๋ฅผ ๋ง๋ค์ด ๋ชจ๋ธ๊ณผ ํ ํฌ๋์ด์ ๋ฅผ ๋ณ๋๋ก ๋ฐ์์ค๋๋ก ์์
- read/train.py์ run_mrc ํจ์์ ๋ด๋ถ ํจ์๋ฅผ class ํจ์๋ก ์์ ํ์ฌ ์ฝ๋์ ๊ฐ๋ ์ฑ ๋์ผ ์์
Retrieval
- ์ฑ๋ฅ์ด ๋๋ฌด ๋์๋ค. ๋น ๋ฅด๊ฒ dense embedding์ ๊ตฌํํ์. (์์์ผ)
- Dense embedding ๊ณต๋ถํ๊ณ ๋ฐํ, ๊ตฌํ (๋ฐ๋ง๋ฃจ์ฐฌ)
data ๋ถ์ (+ ๊ฐ ํ์ด์ฆ๋ณ input - output)
- ์๊ฐ์ด ๋จ๊ฑฐ๋, ๋ค์ ๋์ ์ด ์ด๋ ต๋ค๋ฉด ์งฌ์ ๋ด์ ์๋ํด ๋ณด์. ๋น ๋ฅผ์๋ก ์ข๋ค.