Egyszempontos varianciaanalízis - modszerek/statisztika GitHub Wiki

  • Alkalmazhatósági köre: Az egyszempontos varianciaanalízis a kétmintás t-próba általánosított változata, mely kettőnél több független csoport esetén képes egy legalább intervallum változó átlagának összehasonlítására.
  • A próba nullhipotézise szerint az átlagok megegyeznek a két csoportban.
  • Előfeltételei a normál eloszlás és a szórásegyezés, de mivel robusztus próbáról van szó, e feltéltelek nem teljesülése nem feltétlenül vezet torzított eredményhez.

Példa az egyszempontos varianciaanalízishez

Egy teszt esetében fontos szempont, hogy minden adatfelvevő ugyanazon módon, standard körülmények között végezze az adatfelvételt. Ha több adatfelvevőnk van és elég nagy az adatok elemszáma, akkor érdemes rögzíteni az adatfelvevők azonosítóját is, és ellenőrizni, hogy valóban nincs különbség a tesztfelvétel módjában. Egyik vizsgálatban 3 kísérletvezető vett fel munkamemória tesztet egyetemisták egy csoportjával. Ellenőrizzük, hogy a hallási mondatterjedelem teszt felvételét egyformán végezték-e a kísérletvezetők? (Az adatok a Statisztika.xls ’hallasi_mondatterj’ fülénél találhatóak.)

A próba kiválasztásának szempontjai

Mivel 3 személy végezte az adatfelvételt, ezért három csoportunk van, és mindhárom csoportban ugyanazt a változót vizsgáljuk, a hallási mondatterjedelem teszt pontszámait, amit intervallum változónak tekinthetünk. Ha csupán két csoportunk lenne, kétmintás t-próbával megoldható lenne a feladat, most viszont egyszempontos variancia-analízist kell használnunk.

Példa megoldása SPSS-ben

Az egyszempontos varianciaanalízis az Analyze > Compare Means > One-Way ANOVA paranccsal érhető el. Az alábbi ábra mutatja, hogy milyen beállítások szükségesek a próba elvégzéséhez:

A Levene-próba eredménye nem szignifikáns, tehát a szórásegyezés feltétele teljesül (F(2,175)=1,933, p=0,148):

Az egyszempontos variancia-analízis alapján megállapítható, hogy a hallási mondatterjedelem teszt átlaga szignifikánsan különbözik a kísérletvezetők alapján képezett csoportokban (F(2,175)=3,862, p=0,023).

Post-hoc tesztek az SPSS-ben

Az ANOVA-táblázat csak azt mutatja meg, hogy van-e szignifikáns különbség, de azt nem, hogy pontosan melyik csoportok között. Ennek megállapítására több utóteszt is van, melyek a Post hoc fülre kattintva választhatóak ki. Nincs egyetlen általánosan elfogadott eljárás, amit mindenki használ, az egyes szempontokat mérlegelve kell kiválasztanunk a számunkra legmegfelelőbbnek tűnőt.

A post-hoc tesztek elsősorban aszerint vannak csoportosítva, hogy a szórásegyezés feltétele teljesül-e. A próba kiválasztásánál két fontos szempontot kell figyelembe vennünk: mennyire könnyen lehet vele különbséget kimutatni (mennyire engedékeny), illetve mennyire megbízható. A két szempont között negatív összefüggés van, az engedékenyebb próbák kevésbé megbízhatók, és fordítva, a megbízhatók szigorúbbak. Az SPSS-ben a post-hoc tesztek e két szempont szerint vannak sorbarendezve, így például szórásegyezésnél a legelső felkínált próba, az LSD (Least Significant Difference), amellyel a legkorábban lehet különbséget kimutatni, ugyanakkor a megbízhatósága alacsony, továbbhaladva pedig nő a próbák megbízhatósága és szigorúsága. A leggyakrabban használt post-hoc tesztek közé tartozik például a Tukey’s b, illetve a Dunnett’s T3, ha a szórások különböznek. (Mindegyik post-hoc tesztről rövid ismertetőt találunk az SPSS Help menüjében).

Ezúttal három post-hoc tesztet jelöltünk ki (mivel a Levene-teszt szórásegyezést mutatott, ezért a felső blokkból választottunk). Nézzük meg a különbségeket közöttük:

A Tukey’s b és a Scheffe próba azonos eredményt mutat: nincs különbség a 2-es és a 3-as (p=0,109), sem a 3-as és az 1-es kísérletvezető által felvett tesztek átlaga között (p=0,901), csupán a 2-es és az 1-es kísérletvezető által felvett tesztek pontszáma különbözik (p<0,05).

Az LSD-teszt még egy különbséget jelez a kísérletvezetők között ellentétben az előző post hoc elemzésekkel: A 2-es és az 1-es kísérletvezető által felvett tesztek pontszáma szignifikánsan különbözik egymástól (p=0,007), akárcsak a 2-es és a 3-as kísérletvezető által felvett tesztek átlagos pontszáma is (p=0,050). A 3-as és az 1-es kísérletvezető által felvett tesztek átlaga között nincs szignifikáns különbség (p=0,640)

Mint láthatjuk, az LSD teszt valóban engedékenyebbnek bizonyult.

A post hoc tesztek eredménye alapján felmerül a gyanú, hogy az egyes kísérletvezetőknél nem standard körülmények között zajlott le az adatfelvétel, bár következtetéseink megbízhatóságát jelentősen növelné, ha azonos elemszámú csoportjaink lennének, így könnyebben elkerülhető ugyanis, hogy valamelyik kísérletvezetőhöz véletlenül jutnak túl jól vagy túl rosszul teljesítő vizsgálati személyek, és ezért mutatnak a próbák szignifikáns különbséget.

Példa megoldása Excelben

A variancia-analízis előtt itt is szükség lesz az adatok csoportosítására a kísérletvezetők szerint (ennek módja megtalálható a kétmintás t-próbánál), majd rakjuk egymás melletti oszlopokba a három csoport adatait. A varianciaanalízis az Eszközök > Adatelemzés > Egytényezős varianciaanalízisre kattintva érhető el. A szükséges beállításokat az alábbi ábra mutatja:

A varianciaanalízis eredménye megegyezik az SPSS-ben kiszámítottal. Ebben az esetben is csak az derül ki, hogy van-e különbség a csoportok között, de az nem, hogy pontosan mely csoportok között. Ha ez utóbbi fontos a kutatásunk szempontjából, akkor kétmintás t-próbákkal tudjuk összehasonlítani a csoportjainkat (kevés csoportnál ez nem túl sok munka). Emellett arra is felhívjuk a figyelmet, hogy a szórásegyezés feltételét sem ellenőriztük a varianciaanalízis elvégzése előtt. Ezt is külön tudjuk ellenőrizni kétmintás F-próbákkal (ennek leírását lásd a kétmintás t-próbánál).

Elemzés megoldása LibreOffice Calc-ban

Data > Statistics > Analysis of Variance (ANOVA)

Egyszempontos varianciaanalízis CogStatban

Az Elemzés > Csoportok összehasonlítása menüpontból válasszuk ki a csoportosító és a függő változót, és ha az előfeltételeknek megfelelnek az adatok, a CogStat automatikusan lefuttatja az egyszempontos varianciaanalízis, és az eredményt APA formátumban megjeleníti.


Az oldalt készítette: Janacsek Karolina