60. HuggingFaces - yojulab/learn_deeplearning GitHub Wiki
- ๋จธ์ ๋ฌ๋ ๊ธฐ์ ์ ์ ๊ณตํ๋ ์คํ์์ค ๋ฐ ํ๋ซํผ ์ ๊ณต์ ์ฒด, ๋ชจ๋ธ์ ํ๋ จํ๊ณ ํ ์คํธํ๋๋ฐ ๊ฑธ๋ฆฌ๋ ์๊ฐ์ด ์๋นํ ๋จ์ฃฝ
- ์ฌ์ ํ์ต๋ ์ธ์ด ๋ชจ ๋ธ, ๊ทธ๋ฆฌ๊ณ image, ์ค๋์ค ๋ฑ ๋ค์ํ ๋ชจ๋ธ์ ์ ๊ณต
- offical
- youtube- HuggingFaces
Dataset
Tokenizers
- (1) ๋ฌธ์ ํ ํฐํ(character tokenization)
- (2)๋จ์ด ํ ํฐํ(word tokenization)
- (3) ํ์ ๋จ์ ํ ํฐํ(subword tokenization)
Gradio
- Build and share machine learning demos and web applications using the core Gradio Python library.
ex) ์ค์ต ์ฝ๋(with classfication) : https://dreamfactory100.tistory.com/49
Models
Transformer
- introduction
- Supported models and frameworks
- Attention ์๊ฐํ
Text classification(๊ฐ์ฑ๋ถ์)
Named entity recognition(NER)
- Dataset XTREME ์ด์ฉ : ๋ค๊ตญ์ด ์ฌ๋, ์ง์ญ, ๊ธฐ๊ด ๊ตฌ๋ถ
- ์ฌ์ฉ์ ์ ์ ๋ชจ๋ธ๋ง
์ง์์๋ต, ์์ฝ, ๋ฒ์ญ, ํ ์คํธ ์์ฑ ๋ฑ
์ฑ๋ฅ์ธก์ ์งํ(Performance Measures) : seqeval Lib
ํ ์คํธ ์์ฑ(Text Generation) : Greedy Search Decoding, Beam Search Decoding
- ์ธ๋ํ๋ก์ฐ๋ ์์น์ ๋ถ์์ ์ฑ, ๋ก๊ทธ ํ๋ฅ ์ฌ์ฉํด ๋ฌธ์ ํด๊ฒฐ
- ๋ก๊ทธ ํ๋ฅ ์ฌ์ฉ vs ๋ก๊ทธ ํ๋ฅ ๋ฏธ์ฌ์ฉ
Pretrained model
- ๋ชจ๋ธ ํ๋ จ ์ต์ : ํน์ฑ ์ถ์ถ(Feature extraction), ๋ฏธ์ธ ์กฐ์ (Fine-tuningใ)
Stable Diffusion
- Fast Stable Diffusion XL on TPU v5e : quality text-to-image model from Stability AI