Week12 Day4 - ai-esg/our-history GitHub Wiki
ํ NLP 11์กฐ Week12 Day4
๋ชฉ์ฐจ
์ผ์
- 2021.10.21 ๋ชฉ
ํ์
- ๋ฌธ์์_T2075
- ๋ฐ๋ง๋ฃจ์ฐฌ_T2078
- ๋ฐ์๋ฉ_T2090
- ์ฐ์์ง_T2137
- ์ค์ํ_T2142
- ์ฅ๋๊ฑด_T2185
- ํํ์น_T2250
์ฃผ๊ฐ ์ผ์
ํผ์ด์ธ์
์ถ๊ฐ ๊ฒฐ์ ์ฌํญ
- ์ฝ๋ ์ดํด๋ฅผ ์ํด PR์ 6๋ช approve๋ฅผ ๊ธฐ๋ํด๋ณด์.
- ํผ์ด์ธ์ ์์ ์ฝ๋๋ฆฌ๋ทฐ๋ฅผ ํด ๋ณด์ (์ต๋ํ ๋น ๋ฅด๊ฒ)
ํ ๋ถ๋ฐฐ
-
Reader
- ์ฐ์์ง
- ์ค์ํ
- ํํ์น
-
Retrieval
- ๋ฌธ์์
- ์ฅ๋๊ฑด
- ๋ฐ์๋ฉ
- ๋ฐ๋ง๋ฃจ์ฐฌ
ํ์น๋ ๋ฉด์ ์ด์ผ๊ธฐ
- deep learning๊ณผ machine learning์ ์ฐจ์ด
- ai tech ๋ฉด์ ๋ชจ์ ์ฐธ๊ณ ๊ฐ ๋์
- ํ๋ ํ๋ก์ ํธ ๋ฌผ์ด๋ดค์
Retrieval
- ์ฑ๋ฅ์ด ๋๋ฌด ๋์๋ค. ๋น ๋ฅด๊ฒ dense embedding์ ๊ตฌํํ์.
- Dense embedding ๊ณต๋ถํ๊ณ ๋ฐํ, ๊ตฌํ (๋ฐ๋ง๋ฃจ์ฐฌ)
- ๋ชฉํ
- retrieval ํ๊ฐ ์ฒ๋
- f1,re,pre,acc
- Refactoring (๊ฐ์ ์ ์ฉํ๊ณ PR)
- elasticsearch ๋์ ํ ๊ธฐ์กด๊ณผ ๋น๊ต
- ํผํฉํด์ ์ฌ์ฉ(elasticsearch, sparse, dense..)
- retrieval ํ๊ฐ ์ฒ๋
- ํ์ต์ด ์ ๋์ง ์๋๋ค. ์ด์ํ๊ฑธ ํ์ตํ๋ค.
- negative์ positive๋ฅผ ๋๋คํ๊ฒ ์์ด์ ํ์ต์์ผ๋ณด์
data ๋ถ์ (+ ๊ฐ ํ์ด์ฆ๋ณ input - output)
- ์๊ฐ์ด ๋จ๊ฑฐ๋, ๋ค์ ๋์ ์ด ์ด๋ ต๋ค๋ฉด ์งฌ์ ๋ด์ ์๋ํด ๋ณด์. ๋น ๋ฅผ์๋ก ์ข๋ค.
- max_length retrieval ์ฑ๋ฅ๊ณผ์ ๊ด๊ณ?
- ์ธ๊ตญ์ด 10๊ฐ ์ด์ ๋ฌธ์ฅ์ ์ ์ธ (์ ์ฒ๋ฆฌ ์งํ)
- URL ํ๊ทธ๋ฑ์ด ์ ๊ฑฐ๋์ง ์์ ๋ถ๋ถ์ด ์กด์ฌํ๋ค (๋ค์ ์ ์ฒ๋ฆฌ ํ๋ฒ์ ํด์คํ์๊ฐ ์๋ค.)
- docs title ์ ๊ณผ์ฐ ์ด๋ป๊ฒ ํ์ฉ ์ ์์๊น??
Retriever
- retriever NLLLoss์ target index๋ฅผ zeros๋ก ์ฃผ๋๋ arange๋ก ์ฃผ๋๋?
-
์ zeros๋ก ํ์ ๋ loss๊ฐ 0์ด ๋์ง?
- ์๋ ด์ด iter 2๋ฒ๋ง์ ๋๋ค
-
์ด๋ค ์ฟผ๋ฆฌ๋ฅผ ๋ฃ๋ ๊ฐ์ ๊ฐ์ context๊ฐ ๊ฐ์ฅ ์ ์ฌํ context๋ผ๊ณ ๋ฌ๋ค.
-
ํ์ต์ ์ํค์ง ์์ ๋ชจ๋ธ๋ ๋๊ฐ์ ๊ฒฐ๊ณผ โ ์ฝ๋ ์์ ๋ฌธ์ ?
-
NLLLoss์ target๋ฅผ [1, 1]๋ก ํ์ตํ๋ฉด ๋จ์๋ฅผ ์ป์ ์ ์์ง ์์๊น? - ์๋ฉ๋
- ๊ฒฐ๊ณผ: ์ฒซ๋ฒ์งธ ์ธ๋ฑ์ค๋ฅผ 0์ผ๋ก ๋ณด๋ [0, 0]์ ๊ฒฝ์ฐ์ ๋๊ฐ๋ค?
- batch ์์๋ฅผ 2๋ฒ๋ง์ ์์๋๋ค?
-
์ฌ๊ธฐ์๋ batch ์ค ์ ๋ต์ ์ฐพ๋ ๊ณผ์ ์ด๋ฏ๋ก(ํ๋๋ง ์ ๋ต ๋๋จธ์ง ์ค๋ต) โ classification ๋ฌธ์ - ์์ง๋
- [0, 0]์ด๋ฉด ๊ฒฐ๊ตญ ๋ชจ๋ ์ค๋ต์ผ๋ก ์๊ฐํด์ loss๊ฐ 0
-
negative sample์ ๊ฐ์๋ฅผ ๋๋ ค๋ณผ๊น? -์์ง๋
-
์ ์ค์ต์ฝ๋์ ๋๊ฐ์ ์คํ์ธ๋ฐ ์ ๋ค๋ฅธ ๊ฒฐ๊ณผ๊ฐ ๋์ฌ๊น?
-
klue๋ฅผ ์ฐ๋ bert-base-multilingual ์ฐ๋ ๋๊ฐ์ ํ์
-
Reader
- Roberta์ Bert์ ์ฐจ์ด ์์๋ณด๊ธฐ
- token ์๋ฒ ๋ฉ + ๋ฌธ์ฅ ์ ์ฒด์ cls ํ ํฐ
- query์ ์๋ฒ ๋ฉ์ ํ ํฐ์๋ค concat โ fully connected layer
- ๋จ์ผ ๋ชจ๋ธ ์ฑ๋ฅ์ klue/roberta-large
- klue + XLNet ์์๋ธ ์๋ํด๋ณด๊ธฐ
- ํ๊ตญ์ด๋ก ๊ธฐํ์ต๋ ๋ชจ๋ธ๋ค ์ค ์ฑ๋ฅ์ด ์ค์ํ ๋ชจ๋ธ๋ค์ ์์๋ธ ๊ณ ๋ คํด๋ณด๋ฉด ์ข์ ๊ฒ ๊ฐ์.
- ์ฌ์ฉํ๋ฉด ์ ๋๋ ๋ชจ๋ธ์ ๋ํ ์ฃผ์๊ฐ ํ์
Elastic Search
- ์๋ฃ
- Readerํ์ด ์๊ฐ๋จ์ผ๋ฉด ์๋ํด๋ณด์
General
- NLLLoss์ CrossEntropy์ ๋ญ๊ฐ ๋ค๋ฅธ๊ฑฐ์ง?