Week11 Day3 - ai-esg/our-history GitHub Wiki
ํ NLP 11์กฐ Week11 Day3
๋ชฉ์ฐจ
์ผ์
- 2021.10.14 ๋ชฉ
ํ์
- ๋ฌธ์์_T2075
- ๋ฐ๋ง๋ฃจ์ฐฌ_T2078
- ๋ฐ์๋ฉ_T2090
- ์ฐ์์ง_T2137
- ์ค์ํ_T2142
- ์ฅ๋๊ฑด_T2185
- ํํ์น_T2250
์ฃผ๊ฐ ์ผ์
ํผ์ด์ธ์
๊ณํ ์๋ฆฝํ๊ธฐ
- MRC ๋ ผ๋ฌธ์์ ์ ์ํ ๋ชจ๋ธ ๊ณ ๋ ค.
- baseline ์ฝ๋, ์ ์ถ๋ ฅ์ ๊ดํ ์ค๋ช ์ ์ค๋นํด๋ณด์. (ํ ๋ถ๋ฐฐ ์ฐธ๊ณ )
ํ ๋ถ๋ฐฐ
baseline ์ฝ๋ ๊ด๋ จํด์ ๋ถ์. ํ๋ณ๋ก ์์์ ํ ๊ฒ.
-
Reader
- ๋ฐ๋ง๋ฃจ์ฐฌ
- ์ฐ์์ง
- ์ค์ํ
- ํํ์น
-
Retrieval
- ๋ฌธ์์
- ์ฅ๋๊ฑด
- ๋ฐ์๋ฉ
๊ฐ์ ๋ฐํ
๊ฐ์ ๋ฐํ (5~10๋ถ ์ฌ์ด) 4 - ์ฐ์์ง 5 - ๋ฌธ์์ 6 - ์ค์ํ 7 - ๋ฐ๋ง๋ฃจ์ฐฌ
์๊ธด ์ง๋ฌธ์ github discussion์ ์์ฑ.
- ๋ต๋ณ๊ณผ ํ ๋ก ์ ์์ ๋กญ๊ฒ ์์ฑ.
๋ฉํ ๋ง
์ผ์ ์กฐ์จ
- ๋ค์์ฃผ ๊ธ์์ผ 6์
๋ด์ฉ
- 1๊ธฐ MRC ๋ฉํ ๋ถ๋ค์ ์ํ์ด๋ค..
- elasticsearch, pororo
- ์์ฐ ์๋ผ์คํฑ์์น.....
- ๋ชจ๋ธ ์ ์ ์ klue ๊ด๋ จ pre-trained model์ ์ฌ์ฉํ์ง ์์์ผ ํจ.
- ๋ฐ์ดํฐ์ ์ด klue์ ๋ถ๋ถ์งํฉ์ด๊ธฐ ๋๋ฌธ. ์ผ์ข ์ cheating.
- ์ถ๊ฐ ๊ณผ์ ๊ฐ ์ฌ๋์ ๋๊ฐ๋๋ค.
- ์ฑ์ฉ ์ง์์ ๋ง์ด ํด ๋ด๋ผ. ์ฝํ
์ ๋ฉด์ ๊ฒฝํ์ ๋ง์์๋ก ์ข๋ค.
- ํ ์ฃผ์ ํ ๋ฒ ์๋ ์ํด๋ฆฌ ์ฑ๋ฆฐ์ง(ํ๋ก๊ทธ๋๋จธ์ค) ๋ฌธ์ ํ์ด๋ณด์ค๋์?
์ฝ๋ ํผ๋๋ฐฑ
- ์ฌ๋๋ณ๋ก ์ฝ๋๊ฐ ํต์ผ์ด ์ ๋์ด ์๋ค
- ์ฝ๋ฉ ์คํ์ผ์ ๋ํ linter๋ฅผ ์ ์ฉํ ํ์๊ฐ ์์ด ๋ณด์ธ๋ค.
- type hint ์ ์ฉํด์ฃผ์ธ์!
์ง๋ฌธ ๋ต๋ณ
-
inner product ์ ์ฐ๋์?
- cosine similarity์์ ์ฐจ์ด :
- ๊ฑฐ์ ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ํฌ๊ธฐ๋ง ๋ค๋ฆ
- ์์์ ํฌ๊ธฐ ordering์ ๋ฌ๋ผ์ง์ง ์์
- ์์์ 100์ ๊ต์ฅํ edgeํ ์ผ์ด์ค ์ผ ๊ฒ
- ์ด๋ฐ ์ฃ์ง ์ผ์ด์ค๊ฐ ๋ฐ์ํ๋ค๋ฉด ๋ชจ๋ธ์ด ์ ์์ ์ผ๋ก ์๋ํ์ง ์๋ ๊ฒ์ผ ๊ฒ์ด๋ค.
- ๋๋ถ๋ถ ์ ๋ ฅ๊ฐ์ด scale ๋์ด ์์ด์ ์ ๋ฐ ๋ฌธ์ ๊ฐ ์๊ธฐ์ง ์์ ๊ฒ
- ์ฐ์ฐ ์๋์ ๋ํ ์ด์ ์ด ์๋ค.
-
Normalize ํด์ค๋ ์๊ด์ ์์ฃ ?
- ๋ต
-
span ์ฐพ๋ ๋ฌธ์ ์์, Bert ์ถ๋ ฅ ์ค context ๋ถ๋ถ๋ง ์ฌ์ฉํ๋๊ฐ?
- 1๊ธฐ ๋ question ๋ถ๋ถ๋ ์ฌ์ฉํ ๊ฒฝ์ฐ๊ฐ ์์๋ค.
-
Bert ๋งจ ๋๋จ์ ๋ญ๊ฐ ๋์ค๋์? z์ธ๊ฐ์?
- ์ดํ์ ์ ํํ ๋ต๋ณ์ ๋๋ฆฌ๊ฒ ์ต๋๋ค.
-
Attention mask, token type id ์ ๋ ฅ์ ๊ณฑํด์ ธ์ ๋ค์ด๊ฐ๋์?
- ๋ค, ์์ธํ ๊ฒ์ ํ์ธํด๋ด์ผ ๋์ง๋ง ๊ทธ๋ด ๋ฏ ํฉ๋๋ค.
-
MRC๊ฐ ๊ฒ์ ๋๋น ์ด๋ค ์ฅ์ ์ ๊ฐ์ง๋์ง
- MRC๊ฐ ์ ํ์ํ๊ฐ -> ์ด๋ค ์ฅ์ ์ ๊ฐ์ ธ๋ค ์ค์์๋๊ฐ
๊ณผ์
- Maxpooling -> Relu, Relu -> Maxpooling : ๋จ์กฐ์ฆ๊ฐ ํจ์์ผ ๊ฒฝ์ฐ ๋ชจ๋ ์ฑ๋ฆฝ