Normális eloszlás - modszerek/statisztika GitHub Wiki
Normális eloszlás a Wikipédián
Az egyes eloszlástípusok közül általában a normális eloszlásra helyeződik a legnagyobb hangsúly (mely folytonos változókra jellemző, a pontos leírás megtalálható bármelyik statisztika könyvben), ugyanis a leggyakrabban használt statisztikai hipotézisvizsgálatok (az összes t-próba, varianciaanalízis, a szórásegyezés ellenőrzésére használt F-próba) alkalmazásának feltétele a vizsgált változók normális eloszlása. Bár e próbák többsége robusztus erre a feltételre nézve, mégis vannak olyan helyzetek, amikor a próba érvényessége jelentősen sérülhet (ennek néhány példájára később még visszatérünk).
Normalitás vizsgálat
Honnan tudhatjuk, hogy változónk normális eloszlású-e? Ha más kutatók már megbízhatóan ellenőrizték (megfelelő mintavétel és elfogadhatóan nagy elemszám mellett), akkor élhetünk azzal a feltételezéssel, hogy a mi vizsgálatunkban is normális eloszlású lesz a változó. Persze ez csak akkor érvényes, ha mi is ugyanazt a mérőeszközt használtuk. A sztenderdizált mérőeljárásoknál szintén eltekinthetünk az ellenőrzéstől, hiszen a sztenderdizálás egyik praktikus szempontja éppen az, hogy a változó normális eloszlású legyen (bár ez sem mindig jelent garanciát).
Ha olyan mérőeljárást használunk, amelyet mi dolgoztunk ki, mindenképp érdemes ellenőrizni az eloszlás alakját, mert a hagyományosan elfogadott elképzelésekkel szemben a legtöbb pszichológiai változó nem normális eloszlású. Egy vizsgálatban például 440 változó eloszlását ellenőrizték, beleértve főleg az Egyesült Államokban gyakran használt képesség- és teljesítmény-, valamint személyiségteszteket, és kivétel nélkül mindegyik eloszlása eltért a normálistól (Micceri, 1989). Magyar nyelvű tesztek adataira vonatkozóan lásd Vargha (2000) könyvét, aki szintén hasonló eredményre jutott.
Kolmogorov-Smirnov teszt és eloszlás alakjának vizsgálata
Az eloszlást ellenőrizhetjük az egymintás Kolmogorov-Smirnov teszttel, amelynek nullhipotézise mondja ki a normális eloszlást (a próba SPSS-ben történő végrehajtását lásd például Sajtos és Mitev, 2007 könyvében). A teszt hátránya, hogy nagyon kevés információt ad az eloszlás alakjáról, ha az nem normális. A két leggyakoribb eltérés a ferdeség (vagyis az eloszlás nem szimmetrikus; skewness) és a csúcsosság (kurtosis). Normális eloszlásnál mindkettő értéke 0. A Kolmogorov-Smirnov teszt helyett célravezetőbb lehet ezt a két mutatót számolni, már csak azért is, mert kis eltérés a nullától még nem jelent túl nagy problémát. Sok kutató csak azt ellenőrzi, hogy mindkét mutató abszolút értéke kisebb legyen, mint 1.
Mielőtt azonban elvégeznénk a normalitásvizsgálatot (akár a ferdeség és csúcsosság mutatóit számoljuk, akár a Kolmorogov-Smirnov tesztet futtatjuk le), fontos az adatokat előkészíteni, azokat a méréseket kiszűrni, amelyekről úgy gondoljuk, hogy hibásak, reakcióidőnél például túl lassú, mert elkalandozott a kísérleti személy figyelme a feladat végrehajtása közben, vagy túl gyors, ha nagyon korán nyomta le a billentyűt (lásd részletesebben A reakcióidők kezelése fejezetet). Gyakran csak azért tér el az eloszlás jelentősen a normálistól, mert ezeket az adatokat benne hagyjuk az elemzésben.
Kiváló összefoglaló a módszerekről, amely bemutatja a SAS, Stata és az SPSS normalitás vizsgálatait
Személyen belüli adatok normalitása
A reakcióidő-adatok esetében érdemes még azt is megemlíteni, hogy személyen belül a reakcióidő eloszlása inkább lognormálishoz hasonlít. Viszont amikor személyenként a több mérés középértékét (átlagát vagy mediánját) kiszámoljuk, akkor ezeknek az átlagoknak az eloszlása várhatóan már normális lesz, feltéve, hogy elég sok mérést végeztünk.
Mikor hagyható el a normalitásvizsgálat?
Az eddigiekben megtárgyaltuk, hogy hogyan ellenőrizzük a változó normalitását, azonban egyes esetekben eltekinthetünk a normalitás feltételétől. Ilyenkor mindig gondosan kell eljárnunk, és minden esetben pontosan tudnunk kell, hogy a normalitás feltételétől eltekinthetünk. Például a kétmintás t-próba érvényessége akkor sérül jelentősen nem normális eloszlás esetén, ha kis elemszámmal dolgozunk vagy a két csoport elemszáma különböző. Tehát ha elég nagy mintát és egyenlő elemszámot tudunk biztosítani a vizsgálatunkban, akkor jelentősen megnő az esélye, hogy normálistól eltérő eloszlás esetén is megbízható eredményeket kapunk. (Persze nem szabad figyelmen kívül hagynunk a próba másik feltételét sem, a szórásegyezést, amelyet most nem tárgyalunk részletesen. Ha a szórásegyezés feltétele sem teljesül és az elemszámok sem egyenlőek, a kétmintás t-próba helyett kiváló alternatíva a Welch-féle d-próba, amelynek érvényességét az említett problémák nem befolyásolják.) Ha pedig nem feltétlenül fontos számunkra, hogy az átlag alapján hasonlítsuk össze vizsgálati csoportjainkat, használhatjuk a Mann-Whitney próbát is, amelyről köztudott, hogy feltétele a változó legalább ordinális mérési szintje, ám az már kevesebbé elterjedt, hogy folytonos változóknál működik igazán jól, míg diszkrét változóknál – amilyen sok ordinális skálájú változó is! – a próba túl konzervatívvá válik. Ha az olvasó szeretné felfrissíteni az egyes próbákra vonatkozó ismereteit, erre kiváló lehetőséget ad Vargha (2000) könyve.
CogStatban
Normalitás vizsgálatHa a normalitást azért vizsgálnánk, hogy egy adott statisztika kiszámításának a feltételét vizsgáljuk, akkor semmi tennivalónk nincs, mert a CogStat ezt automatikusan megteszi helyettünk.
Ha egy változó normalitására külön kíváncsiak vagyunk, akkor Elemzés > Változó vizsgálata menüpontban válasszuk ki a vizsgálandó változót, és a CogStat megmutatja a változó eloszlását és a rá illesztett normális eloszlást, illetve a Q-Q ábráját. Kiszámolja a Shapiro-Wilk féle hipotézis teszt eredményét is, és APA formátumban megjeleníti.
Adatok transzformációja
Ha nem normális az adataink eloszlása, még mindig megoldást jelenthet, ha az adatokat egy megadott transzformációval normál eloszlásúvá alakítjuk.
Összefoglaló a transzformációkról John McDonald könyvében
Egy másik összefoglaló Rich Horsley oldalán
További információ az arkusz szinusz transzformációról Robin High oldalán
Az oldalt készítette Janacsek Karolina és Krajcsi Attila