Lottery Ticket Hypothesis - junhyukso/blog_source_public GitHub Wiki
title: Lottery Ticket Hypothesis date: 2020/10/19 19:32:00 categories:
- DeepLearning
- Efficient DeepLearning
- Pruning tags:
- DeepLearning
- Pruning
- Sparsity
Network Pruning
Pruning์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๊ฒฝ๋ํ ํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ผ๋ก, ์ ํ๋ ์์ค์ ์ต์๋ก ํ๋ฉฐ ๋ชจ๋ธ์์ ์ด๋ ์ ๋์ ํ๋ผ๋ฏธํฐ๋ค์ ์ ๊ฑฐํ๋ ๊ธฐ๋ฒ์ ๋๋ค.
Iterative Pruning
๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ Pruning ๋ฐฉ๋ฒ์ธ Iterative Pruning์ ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ต๋๋ค.
์ฐ์ ์ด๋ ํ ๊ธฐ์ค์ ํตํด ์ค์ํ์ง ์์ ํ๋ผ๋ฏธํฐ๋ฅผ ํ๋จํ๊ณ , ์ ๊ฑฐํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ชจ๋ธ์ ๋ค์ ์ฌํ์ต์ํต๋๋ค.
์ด๋ฌํ step๋ค์ ๋ฐ๋ณตํจ์ผ๋ก์จ, ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ ๋ ์ ๊ฑฐํฉ๋๋ค.
Problem
ํ์ง๋ง, ์ด๋ฌํ ๋ฐฉ์์ ํตํด ์ป์ SubNetwork๋ฅผ, Randomly Initializeํํ, ์ฒ์๋ถํฐ ํ์ต์ํค๊ฒ ๋๋ฉด ๋ณธ๋์ ์ฑ๋ฅ๋ณด๋ค ํฌ๊ฒ ๋ฎ์ ์ฑ๋ฅ์ ๊ฐ๊ฒ๋ฉ๋๋ค.
Iterative Pruning์์ฒด๊ฐ ๊ฝค ๋ง์ HyperParamter๋ค์ด ์๊ณ , SubNetwork๋ฅผ ํ์ต์ํฌ์์๋ค๋ฉด Train FLOPs๋ํ ํฐ ํญ์ผ๋ก ์ค์ผ ์ ์๊ธฐ์ ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ ์ค์ํ์ต๋๋ค.
The Lotter Ticket Hyphothesis[ICLR2019] ์์ ์ ์๋ค์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
The Lottery Ticket Hyphotesis
์ฐ์ Lottery Ticket์ด๋ ์ฉ์ด๋ถํฐ ์ ์ํฉ๋๋ค.
- Lottery Ticket : Original Network ๋ณด๋ค ์ ์ Parameter๋ฅผ ๊ฐ์ง๊ณ , ์ฑ๋ฅ๋ํ ๋ ์ข์ SubNetwork
์ ์๊ฐ ์ ์ํ๋ ์ด๋ฌํ Lottery ticket์ ์ฐพ๋ ๋ฐฉ๋ฒ์ ์๋์ ๊ฐ์ต๋๋ค. ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค.
- 1,2,3๊ณผ์ ์ ํต์์ ์ธ Train -> Iterative Pruning ๊ณผ์ ์ ๋๋ค.
- 4 ์ด์ Iterative Pruning์ผ๋ก ์ฐพ์ SubNetowrk๋ฅผ 1์์ ์ฌ์ฉํ๋ ์ด๊ธฐ๊ฐ์ผ๋ก ์ด๊ธฐํ ํฉ๋๋ค. ์ฆ, Pruning๋ ์คํธ๋ญ์ณ๋ Initialized๋ Weight์ ํฌ๊ฒ ์์กดํ๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
Experimental Results
์ญ์๊ฐ ๊ธฐํธ ์์ ์ซ์๋ ๊ธฐ์กด ๋คํธ์ํฌ ๋๋น ๋จ์์๋ ํ๋ผ๋ฏธํฐ์ ๋น์จ์
๋๋ค.
- ์ ์ผ ์ผ์ชฝ ๊ทธ๋ฆผ์ ๋ณด๊ฒ๋๋ฉด, ๊ธฐ์กด ๋คํธ์ํฌ(100)๋ณด๋ค Lottery ticket๋ค์ ํ์ต๊ฒฐ๊ณผ๊ฐ ์๋ฑํจ์ ์ ์ ์์ต๋๋ค.
- ๊ฐ์ด๋ฐ ๊ทธ๋ฆผ์ ๋ณด๊ฒ๋๋ฉด, 3.6%(๋ณด๋ผ์)๊น์ง๋ ๊ธฐ์กด ๋คํธ์ํฌ๋ณด๋ค ํ์ต๊ฒฐ๊ณผ๊ฐ ์ข์ง๋ง, 1.9%(๊ฐ์)์ ๊ฒฐ๊ณผ๊ฐ ํฌ๊ฒ ๋๋น ์ง๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
- ์ด๋ฌํ SubNetwork์ ํ๋ผ๋ฏธํฐ ์์ ์ด๋ ํ ํํ์ด ์๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
- ์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ์ ๋ณด๊ฒ๋๋ฉด, Lottery ticket๋ฐฉ๋ฒ์ ์ ์ฉํ ๊ฒฐ๊ณผ๊ฐ, ์ ์ฉํ์ง ์์ ๊ฒฐ๊ณผ(reinit)๋ณด๋ค ์๋ฑํ ์ข์์ ํ์ธํ ์ ์์ต๋๋ค.
์ ์๋ค์ Simple Convnet์ด๋ Deep Convnet(VGG,ResNet..)์ ๋ํด์๋ ์คํ์ ์งํํ์๋๋ฐ, ๋ช๊ฐ์ง ํด๋ฆฌ์คํฑ์ด ๋ค์ด๊ฐ๊ธดํ์ง๋ง ๋ชจ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์์ต๋๋ค.
References
Frankle, Jonathan, and Michael Carbin. "The lottery ticket hypothesis: Finding sparse, trainable neural networks." arXiv preprint arXiv:1803.03635 (2018).