How to use chi squared test with Hash Function? - minseok127/HashSimulator GitHub Wiki
Hypothesis
Chi squared test๋ฅผ ์ํํ๊ธฐ์ ์์ Hash Table์ ๋ํ ์ ์ ์กฐ๊ฑด์ ์ค๋ช ํ๊ฒ ์ต๋๋ค.
- Hash Table์ ์กด์ฌํ๋ bin์ ๊ฐ์๋ m
- Hash Table์ ๋ฃ์ Key์ ๊ฐ์๋ k
์ด๋ฅผ ์ ์ ๋ก ํ๋์ bin์ ์ด์์ ์ผ๋ก ๋ค์ด๊ฐ key์ ๊ฐ์๋ k / m ๊ฐ์ ๋๋ค(Uniform Distribution).
๋ํ k๊ฐ ์นด์ด์ ๊ณฑ๋ถํฌ์ ์์ ๋๋ก ์ค์ ๋ฉ๋๋ค.
Chi squared Value
bin์ Index๋ฅผ i๋ผ๊ณ ํํํ ๋, i๋ 0์์ m-1๋ก ๋ํ๋ผ ์ ์์ต๋๋ค.
bi๋ฅผ i๋ฒ์งธ bin์ ๋ค์ด์๋ key์ ๊ฐ์๋ผ๊ณ ๊ฐ์ ํ๋ค๋ฉด ์นด์ด์ ๊ณฑ๊ฐ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
ฯ2 = ฮฃ (bi - k / m)^2 / (k / m)
์ฃผ์ด์ง ๋ชจ๋ k๊ฐ์ key๋ค์ Hash Function์ผ๋ก ๊ณ์ฐํ๊ณ ์ด๋ฅผ ํ ๋๋ก bi๊ฐ์ ๊ฒฐ์ ํฉ๋๋ค.
Get the p-value
์์ ๊ฐ์ด ์นด์ด์ ๊ณฑ๊ฐ์ ๊ตฌํ ๊ฒ์ผ๋ก ํ ๋๋ก, ์์ ๋๊ฐ m์ธ ์นด์ด์ ๊ณฑ๋ถํฌ ์์์ p-value๋ฅผ ๊ตฌํฉ๋๋ค.
์ด p-value๊ฐ์ด ๋๋ฌด ์๊ฑฐ๋, ๋๋ฌด ํฐ ๊ฒฝ์ฐ Uniform Distribution์ ๋ํ๋ธ๋ค๋ ๊ฐ์ ์ ๊ธฐ๊ฐํ๊ฒ ๋ฉ๋๋ค.