A függetlenségi kritérium chi-négyzet teszt MS Excel - kompatibilis a Microsoft Excel 2018, Excel 2018

Tegyük fel, hogy egy mintát reprezentáló felmérésének eredménye 500 fő. Az emberek állították 2 kérdés: arról, hogy a családi állapot (házas, polgári egyesület, nem egy kapcsolat) és ezek a foglalkoztatási szintet (teljes munkaidős, részmunkaidős, ideiglenesen nem dolgozik a háztartásban, a nyugdíjas, tanuló). Minden választ kerülnek a táblázatban:

A függetlenségi kritérium chi-négyzet próba MS Excel - kompatibilis a Microsoft Excel 2007, Excel 2010

Ez a táblázat az úgynevezett kontingencia tábla (vagy asztal tényező, Eng. Rendkívüli táblázatot). A elemek a kereszteződésekben a sorok és oszlopok a táblázat általánosságban Oij (az angol. Megfigyelt, azaz a megfigyelt, tényleges frekvencia).

Mi érdekli a kérdést: „Vajon Családi állapota befolyásolja a foglalkoztatást?”, Azaz hogy van-e összefüggés a két mintavételi módszerek besorolás?

Amikor a vizsgálat ilyen hipotézis általában feltételezik, hogy a nullhipotézis azt állítja, hogy nincs módja besorolásától függően.

A függetlenségi kritérium chi-négyzet próba MS Excel - kompatibilis a Microsoft Excel 2007, Excel 2010

Ebben az esetben, a családi állapot egyértelműen meghatározza az időt (lásd. Példa magyarázata lemez fájl). Ezzel ellentétben, egy példa a teljes függetlenséget másik felmérés eredménye:

A függetlenségi kritérium chi-négyzet próba MS Excel - kompatibilis a Microsoft Excel 2007, Excel 2010

Felhívjuk figyelmét, hogy a százalékos foglalkoztatás ebben az esetben nem függ a családi állapot (ugyanaz a házas és nem házas). Ez pontosan ugyanaz, mint a szövege a null hipotézist. Ha a nullhipotézis igaz, akkor az eredményeket a felmérés volt, hogy úgy kell elosztani a táblázatban, a foglalkoztatottak aránya ugyanaz lenne, függetlenül a családi állapot. Ezzel, kiszámítjuk a felmérés eredményei, amelyek megfelelnek a null-hipotézis (lásd. Példa példa lemez fájl).

Először kiszámítjuk a valószínűség-becslés, hogy a mintavételi elem lesz egy bizonyos ideig (lásd oszlop ui.):

A függetlenségi kritérium chi-négyzet próba MS Excel - kompatibilis a Microsoft Excel 2007, Excel 2010

ahol C - az oszlopok száma (oszlopok), a szintek számát egyenlő a változó „kapcsolat”.

Ezután kiszámítjuk a becslés a valószínűsége, hogy a minta tagja lesz egy bizonyos családi állapot (lásd. Vj vonal).

A függetlenségi kritérium chi-négyzet próba MS Excel - kompatibilis a Microsoft Excel 2007, Excel 2010

ahol r - sorok száma (sorok), a szintek számát egyenlő a változó „foglalkozás”.

Elméleti frekvencia eij minden egyes cella (. Angol Várható, azaz a várt frekvencia), amikor a független változó képlettel számítottuk ki:
Eij = n * ui * vj

A függetlenségi kritérium chi-négyzet próba MS Excel - kompatibilis a Microsoft Excel 2007, Excel 2010

Ismeretes, hogy a statisztikák a X 2 0 nagy n kb HI2-eloszlást (R-1) (c-1) szabadsági fok (df - szabadsági fok):

A függetlenségi kritérium chi-négyzet próba MS Excel - kompatibilis a Microsoft Excel 2007, Excel 2010

Megjegyzés. A fenti statisztikák c = 1 kiszámításához használt konszenzus Pearson chi-négyzet próba (lásd. Cikk hipotézis tesztelése chi-négyzet Pearson Excel).

Ha a „túl sok” alapján számítják minta értéke ez a statisztika (nagyobb, mint a küszöbérték), akkor a nullhipotézist elutasítjuk. A küszöbértéket alapján kerül kiszámításra a szignifikancia szintjét. például keresztül HI2.OBR.PH képlet = (0,05; df).

Megjegyzés. A szignifikancia szint általánosan elfogadott, hogy 0,1; 0,05; 0,01.

Amikor azt vizsgáljuk, egy hipotézist is kényelmes kiszámításához p-értékkel. hogy összehasonlítjuk a szignifikancia szintjét. p-számolt érték HI2-eloszlást (R-1) * (c-1) = df szabadsági fokkal.

Ha a valószínűsége, hogy egy valószínűségi változó, amelynek HI2-eloszlást (R-1) (c-1) szabadsági fok fog feltételezni értéke nagyobb, mint a számított statisztika X 2 0. azaz P (r-1) * (c-1)> x 0 2>, kevesebb, mint a szignifikancia szintjét. A null hipotézist elvetjük.

MS Excel p-érték képlet szerint kiszámított HI2.RASP.PH = (X 0 2; df). Természetesen közvetlenül megelőzően értékének kiszámításánál a statisztika X 2 0 (ez történik a példa fájl). Azonban ez a legjobban használni a funkciót HI2.TEST (). Az érvek e a funkció meghatározza, linkek a valódi tartományok tartalmazó (megfigyelt) és a számított elméleti frekvencia (várható).

Ha a szint a jelentőségét> p-értékkel. Ez azt jelenti, tárgyi és elméleti sebesség mellett számított a null hipotézist. Ezek nagyon különböző. Ezért a nullhipotézist el kell utasítani.

Használata HI2.TEST () funkció lehetővé teszi, hogy gyorsítsák fel a folyamatot a hipotézisek tesztelésére. mert nem szükséges értékének kiszámításához a statisztikát. Most elegendő összehasonlítani az eredményt HI2.TEST () függvény egy adott szignifikanciaszint.

Kapcsolódó cikkek