Week18 Day2 - ai-esg/our-history GitHub Wiki
ํ NLP 11์กฐ Week18 Day2
๋ชฉ์ฐจ
์ผ์
- 2021.11.30 ํ
ํ์
- ๋ฌธ์์_T2075
- ๋ฐ๋ง๋ฃจ์ฐฌ_T2078
- ๋ฐ์๋ฉ_T2090
- ์ฐ์์ง_T2137
- ์ค์ํ_T2142
- ์ฅ๋๊ฑด_T2185
- ํํ์น_T2250
์ฃผ๊ฐ ์ผ์
ํผ์ด์ธ์
- ๋ชจ๋ธ ์ต์ ํ
- ๊ฐ์๋์
- ์ ์ง ๋ชฐ๋ผ๋ ๋ฐ์ดํฐ ๋ณํ์ ์ฃผ๋ ๊ฒ์ ํจ๊ณผ๊ฐ ์์ด๋ณด์
- squeeze net ๋ง๋ค๋ ค๊ณ ํ๋๋ฐ, module ์ถ๊ฐ ์ ๋๋ก ๋์ง ์์
์ต์ข ํ๋ก์ ํธ
์ต์ข ํ๋ก์ ํธ์์ ์์ฑ
Auto ML
-> ๋๋ ์ ๋๋ฆฌ -> DB-> ์ฌ๋์ด ์ ๋ถ ์ ์
๋ถ์
์ฝ๋ -> MRC branch model
- ์ ์ฒ๋ฆฌ (์์ธ๋ง)
- raw (๊ธ ์๋ ๊ฒ๋ง ์ ์ธ)
- ๋ชจ๋ธ (์์ธ๋ง)
- In-batch
- Context ๊ฐ๋ณ (๋ฌด์ง์ฑ ๊ฒฐํฉ, ๋ชจ๋ ์กฐํฉ), ํตํฉ
- Non In-batch
- Context ๊ฐ๋ณ (๋ฌด์ง์ฑ ๊ฒฐํฉ), ํตํฉ
- In-batch
- ์คํ -> ์ ์ฒ๋ฆฌ ์์ ํ๊ณ ๋ฐ๋ณต
- ํ ๋ง๋ณ ์ฑ๋ฅ ๋น๊ต
- Context ์ ๋ํ ๊ฒ์ฆ
- ์กฐ๊ฑด ์ผ์ ์ ์ ์ด์์ผ ๊ฒฝ์ฐ(acc/f1 ?? ์ด์์ธ ๊ฒฝ์ฐ) top 10๊ฐ์ ํฌํจ๋ ๊ฒฝ์ฐ
์คํํ ์ฌํญ
-
'๊ด๋ช ๋๊ตด' ์ด๊ฑด ์ง์ง ์ ์ฐพ์์ผ ๋ง๋๊ฑฐ ๋ฐ์ดํฐ๊ฐ ์ ๋ง ๋ง์
-
Non in-batch / query, context top 10 pair
-
In-batch / query(1), context(1)
-
context ํ์
-
ํ๋์ ๋ช ์์ ๊ฐ๋ณ context
- ๋ชจ๋ธ์ ๋๋ ค์ ์์ N๊ฐ ์ค ๊ฐ์ฅ ๋ง์ ๋ช ์๊ฐ ๋ต
- train pair๋ฅผ ๋ง๋ค์ด์ผ ํ๋๊ฑฐ ์๋๊ฐ์??
- ๊ฐ๋ณ ๋ด์ฉ ์์ ๋ดํ
- blog
- ํ๊ฒ๋๋ค๋ฉด ๊ทธ๋ฅ ๊ฐ context๋ณ๋ก score์ ๋ด๋ ๋ฐฉ์? ๊ณฑ๋ณด๋ค๋ ํฉ? ํฉ์ด๋ผ๊ณ ํ๊ธฐ์๋ ์ค๋ณต์ด ๋ฌธ์ ์ธ๋ฐ. train
-
ํ๋์ ๋ช ์๋ฅผ ํฉ์น context
- ๋ชจ๋ธ์ ๋๋ ค์ top 1์ด ๋ต
- blog ์ ๋ถ ํฉ์ณ์ง ์ํ
- ๋ชจ๋ธ์ ๋๋ ค์ top 1์ด ๋ต
-
์ ์ฒ๋ฆฌ
๊ธฐ์ค Dense
- ๊ธธ์ด
- ๋ถ์ ์ ์ธ ๋ฆฌ๋ทฐ(Dense ๊ธฐ์ค)
- ๋ฒ์ญ ๋ฌธ์ฅ (์๋๋ฒ์ญ)
- (Google ๋ฒ์ญ ์ ๊ณต) ์์ฃผ ๋ฉ์ง๋ค! (์๋ฌธ) ะัะตะฝั ะบะปะฐััะฝะพ!
blog
- ํด์ฌํ๊ทธ ์ ๊ฑฐ(ํ๊ธ๋ง)
- @ ํ๊ทธ ์ ๊ฑฐ
- ๊ณต๋ฐฑ 2๊ฐ ํ๊ฐ๋ก ๋ณ๊ฒฝ
- URL
- dict ํ์ ์ ๊ฑฐ
- context = re.sub(r""".(?=[^ ])""", ". ", context)
- ์๋ ๋์จ ๋ฌธ์์ธ ์ ๋ถ ์ ๊ฑฐ
google api ํฌ๋กค๋ง
- ๋ค ๊ฐ์ด ๋๋ฆฌ๋ ์ค (time.sleep() <- ์ด๊ฑฐ ์ค์ด๋ฉด ๋ ๋นจ๋ฆฌ ๋จ)
- ๋ค ๋๋ฉด?