Tesztelés Statisztikai hipotézisek 1
§1. Statisztikai hipotézis. Alapvető fogalmak.
problémáját hipotézisek tesztelésére módon emlékeztet a megbecslése problémát a paramétereket a lakosság a minta adatai: Márka megnyilatkozások alapján és a mintavételi adatok alapján ítélik meg az érvényességét ezt az állítást.
Statisztikai hipotézis azt állítják, hogy bármilyen statisztikailag fenntartható események (események, hogy előfordulhat többször azonos körülmények között).
1. Általános népesség normális eloszlású;
2. A diszperziók a két normális eloszlás egyenlő;
3. jellemző diszperziós szét a lakosság
· Ha a hipotézis azt állítja, valamit a jelentését egy paraméter, akkor azt a hipotézist, az úgynevezett parametrikus.
Ha a hipotézis azt sugallja, hogy valami nem mennyiségileg mérhető (például „tulajdonságnak van egy normális eloszlás”), azt a hipotézist, az úgynevezett nem-paraméteres.
· A fő (null) hipotézis nevezzük azt a hipotézist.
· Egy másik (versengő) nevezzük hipotézis, amely ellentmond meghosszabbítható.
· A hipotézis az úgynevezett egyszerű, ha a válasz, hogy ez egyértelmű ( „jele egy normális eloszlás, a szórás az elosztó egyenlő 2”)
Ha a válasz nem egyértelmű, azt a hipotézist, az úgynevezett komplex.
2. §. I. típusú és II hibákat.
A hipotézis lehet helyes vagy helytelen, ezért szükséges, hogy ellenőrizze empirikus adatok (a minta). Mivel a tartalmát a minta véletlen, akkor a nyilatkozatai alapján a mintavételi tanulmányok véletlenszerűek, azaz Ezek lehetnek helyes és helytelen.
Ennek eredményeként a hipotézist tesztelve hibás döntések a két esetben lehet venni, azaz a hibákat lehet két típusa van:
1. A hiba az első fajta - az úgynevezett hiba esetében megengedhető, ha a fő hipotézist utasítani helyes (elutasítják ugyan igaz);
2. A hiba a második fajta - nevezzük elkövetett hibák esetén hibás, alaphipotézist (elfogadható, bár ez nem igaz);
Vizsgálati eredmény alaphipotézist
Nem negatív statisztikai hipotézis tesztelés nem jelenti azt, hogy a feltételezésünk, hogy a legjobb, és csak a megfelelő, ez nem csak ellentétes a legjobb mintaadatforrásainkat, de ugyanazokkal a tulajdonságokkal lehet más hipotézisek.
Döntés a helyes hipotézis vagy hamisság alapul statisztikai kritériumok alapján.
3. § A statisztikai próba. A kritikus területen. Terület elfogadásának a hipotézist. Kritikus pont.
Hogy ezt a feltevést segítségével speciálisan kiválasztott véletlen változó, pontos vagy hozzávetőleges eloszlása ismert.
Q. A véletlen változó használják, hogy ellenőrizze a hipotézis az úgynevezett statisztikai kritérium vagy feltétel. A megfigyelt érték az úgynevezett kritérium értéket számítjuk ki a minta.
Miután kiválasztotta a kritériumoknak az összes lehetséges értékek oszlik két különálló részhalmaza:
· Az egyik tartalmazza az érték a kritériumot, amely elutasította - ez az úgynevezett kritikus területen S.
· Egyéb értékét tartalmazza a kritériumot, amely hipotézist elfogadjuk - ez az úgynevezett régió elfogadásának a hipotézist. (Megengedett terület).
A kritikus pont az úgynevezett pont meghatározása a kritikus terület a döntés-hipotézis megkülönböztetni;
1. Az egyoldalú és két oldalú kritikus területen.
Egyoldalú osztva:
· Jobb oldali kritikus régióban;
· Baloldali kritikus régióban;
Különösen, ha a kritikus pontok szimmetrikus nulla, akkor a kétirányú terület határozza modulo | Q |>.
Általában a kritérium egy többdimenziós valószínűségi változók, de úgy véljük, a legegyszerűbb méretbeli követelményeknek a jövőben.
Kritikus és megvalósítható régió egydimenziós numerikus készletek. Típus kritikus terület típusától függ a fő és alternatív hipotézisek.
4. § A szignifikancia szintet és a hatalom a vizsgálatot.
1. Annak a valószínűsége, hogy egy hiba az első fajta az úgynevezett szignifikanciaszint kritériumok és jelentésük.
Annak a valószínűsége, II-es típusú hibák jelentik.
2. A hatalom a teszt neve a valószínűsége ütő egy kritikus szempont a területen, feltéve, hogy az alternatív hipotézis igaz. (Azaz, a hatalom a teszt -. A valószínűsége elfogadhatatlansága a második fajta hiba.)
Általában az alapértelmezett érték: # 945; = 0,05, # 945; = 0,01.
Nem számít, hogy milyen kicsi a mennyiség. bekerülni a kritikus terület csak valószínű, de nem teljesen lehetetlen esemény.
A kevésbé. annál kevésbé valószínű a hiba az első ilyen. A csökkenés a kritikus területen csökken.
Ha = 0, a hipotézis - mindig kell venni, függetlenül a minta eredménye. Csökken. növekedését jelenti a hiba valószínűségét a második fajta.
Egyidejű hibák csökkentése az első és a második csak akkor lehetséges, azáltal, hogy növeli a minta mérete.
Jellemzően, amikor tesztelés egy hipotézis egy bizonyos szintű fontosságát és a minta mérete n. A kritérium ellenőrzésére kiválasztott maximális kapacitása volt.
5. § típusai kritikus területeken.
Hagyja a hipotézis vizsgálatára egyenlőség paraméter az általános elosztás, mint az általános átlag. és hogy teszteljék a hipotézist, hogy a kritérium Q. eloszlása a következő:
1. Ha az alternatív hipotézis terjesztett elő. . a kritikus terület természetes meghatározni. azaz válassza ki a bal oldali a kritikus terület.
Feltételezve, hogy a szignifikancia szintjét az egyenlet. Mi található a bal oldali területen.
2. Az alternatív hipotézis. A kritikus régió a következő egyenletből meghatározzuk. Ez az úgynevezett jobb oldali kritikus területen.
3. Ha az alternatív hipotézis megfogalmazása formájában. A beépített kétoldalas kritikus területen.
Kritikus pontok találhatók az egyenletből.
Leggyakrabban kétirányú kritikus területen van kialakítva, szimmetrikus:
6.§. Vizsgálati módszerei a hipotézist.
Sok különböző statisztikai vizsgálatok a különböző statisztikai problémák. Ugyanakkor tudjuk leírni az általános rendszer.
Matematikai statisztikai hipotézisvizsgálat csökken a következő lépéseket:
1. lépés. Megfogalmazni a fő hipotézist kell vizsgálni; mindkettő jelezte, hogy melyik alternatívát kell tenni csekk, azaz megfogalmazott egy alternatív hipotézist.
2. lépés. Válogatott statisztikai kritérium - Egy véletlen értéket, számított eredményei alapján a minta.
3. lépés. A formulázott érvényesítési szabály meghatározható megfelelő minta térfogata az n előre meghatározott szignifikancia szint és a teljesítmény kritériumokat vagy feltételeket az adatok és minimalizálása.
4. lépés. Attól függően, hogy a hipotézist, hogy a vizsgálandó és alternatívái választott egy- vagy kétoldali ellenőrzést.
A választás az alternatív hipotézis által diktált az ellenőrző szervezet.
5. lépés. Az ismert megoszlása a kritériumnak számított kritikus pont.
6. lépés. Vétele és az így kapott mintát számítjuk végrehajtása megfigyelt érték kritérium. Ha ez az érték alá esik a kritikus terület, a hipotézis nem ismeri a vonatkozó megfigyelési adatok és ezért elutasították. Ha lenyelik a megengedett tartományon, akkor a hipotézis nem tekinthető ellentétesnek minta adatok és valószínűnek tűnik.
Minden típusú tesztelhető hipotézisek kidolgozták a megfelelő feltételeket. valószínűségi változók legáltalánosabban alkalmazott normális eloszlásból, a (Pearson négyzet), t-eloszlás, F-eloszlás Fischer - Snedecor.
A fenti séma vizsgálat azt sugallja, hogy a törvény a népesség megoszlása ismert és értékelés tárgyát képezik egy vagy több elosztórendszer paramétereket.
Az ilyen hipotézisek nevezzük parametrikus.
Valamint ezek a hipotézisek kell végezni a statisztikai vizsgálatok és az ismeretlen eloszlású törvény a lakosság körében. Releváns hipotézisek nevezzük nonparametric.
Nemparaméteres kritériumok jelentősen alacsonyabb teljesítmény, mint parametrikus, azaz ugyanazokat a határértékeket kell több kísérleti adat.
Másrészt, nem parametrikus kritériumok használhatók bármilyen joga a népesség megoszlása és hasznosak, mint a mennyiségi vagy minőségi attribútumokat.
7. § Néhány tipikus feladatait tesztelés paraméteres hipotézist.
Vegyünk néhány gyakori probléma megoldható a segítségével hipotézisek tesztelésére. Ez mindenekelőtt:
· Problémák összehasonlítása (összehasonlító minta jellemzőit szabályozási tulajdonságok)
· Összehasonlítva a jellemzőit két minta egymással (a hipotézis vizsgálatára, hogy ezek a minták, amelyek ugyanabban a lakosság).
Tipikus nem-paraméteres probléma:
· Hipotézis tesztelése a szelektív forgalmazási;
· Ellenőrizze szignifikáns különbség a minta jellemzőit.
7.1 hipotézisek tesztelésére a középérték.
a) összehasonlítjuk az átlagos érték a normál érték.
Az ilyen problémák merülnek fel, miközben teszteli a terméket, amelyet az jellemez, néhány átlag:
1. Az átlagos idő az eszköz;
2. Az átlagos mérete a részek, stb
b) összehasonlítása az átlagértékek a két.
Tegyük fel, hogy van két, azzal jellemezve, átlagértékek. eltéréseket és.
Feltételezik, hogy az átlagok egyenlők. t. e
A teszt a hipotézisek elsődleges kritériuma
Ettől. alatt a nullhipotézis lesz.
A diszperziós tulajdonságainak és feltételezve független mintát, ezt kapjuk:
Így a további feltételezés, hogy az eltérések a két populáció egyenlő, azaz kapjuk:
A feltételezés az egyenlő varianciák szükségük van egy speciális vizsgálat, ami lesz szó a következő részben.
Behelyettesítve ezt a képletet a kritériumok a következők:
Ha mind a minta térfogata elegendően nagy, a véletlen érték és a véletlen változó normális eloszlású, azonban, és általában osztják kritérium.
Cseréje az ismeretlen szórás a teljes népesség annak elfogulatlan mintán alapuló becslés.
Azért jöttünk, hogy a normál elosztási kritériumok:
További vizsgálatot hajtanak végre a szokásos módon, táblázatok Laplace eloszlás függvények.
Ha a mintavevő és alkalmazása kis mennyiségű normális eloszlás hibákhoz vezethetnek, ugyanezen kritériumot Z Student-féle t-eloszlás több szabadsági fokkal.
7.2 Összehasonlítás diszperziók 2-készletek.
Tegyük fel, hogy két normális eloszlású populáció, amely egyenlő a variancia; null hipotézist.
Mivel a diszperzió a populációk nem ismert, hogy teszteljék a hipotézis az összehasonlítás alapján a minta és diszperziók. Ha az arány. közel 1, nincs ok arra, hogy elvetjük a nullhipotézist, ha jelentősen eltérő - a hipotézist elvetjük. Annak a kérdésnek, mennyivel nagyobb legyen a különbség a minta eltérések az elutasítás a null hipotézist megalapozott, a használt arány
A eloszlása ez az arány az úgynevezett F-eloszlás Fisher - Snedecor, attól függ, hogy a két paraméter - száma szabadsági fokok, a számláló és a nevező és. ahol - mintaméretekhez. És a megadott szám zárójelek mellett a számított F érték:
A kritikus régiót kialakítva típusától függően az alternatív hipotézisek:
1. A null hipotézist. Egy másik feltételezés szerint. if ().
Egy adott # 945; és az ismert és Fischer kiosztási táblázat - Snedecor talál kritikus. H hipotézis tesztelés 0svoditsya a következő szabály: ha az arány a minta varianciák. 0otklonyaetsya hipotézis H; if. 0ne hipotézist H elutasítják.
2. Az alternatív hipotézis.
Ebben az esetben az épület szimmetrikus kétoldalas kritikus területen a kritikus pontokat és. meghatározható az egyenlőtlenségek
Jobb kritikus pont közvetlenül az asztalon, a Fisher kritikus pont elosztás - Snedecor a szignifikanciaszint és szabadsági fokkal. Bal kritikus pont táblázat nem tartalmazza, de a kiválasztott szimmetrikus módszert alkalmaztuk, a kritikus terület, elért penetrációs F kritérium a kritikus területen valószínűséggel szignifikanciaszint .tak mindkét szintjének meghatározása a jelentősége. A választott. érkezünk időben és. H hipotézis tesztelése 0proizvoditsya ugyanazon szabály, hogy abban az esetben, egyoldalú kritikus terület, de feltétel táblázatba foglalt értékek keresi értéket. fél rövidebb, mint egy előre szignifikanciaszint: ha az arány minta eltérések. null hipotézist H 0 akkor selejtes, ha azt a hipotézist, H 0 elutasítják.
8. § Nem paraméteres hipotéziseket. Pearson és Kolmogorov hozzájárulását.
Előzőekben ismertetett eljárások tesztelésére hipotéziseket az egyes paramétereket az általános forgalmazási.
Egy különleges hely van elfoglalva hipotézisek az összhang az eloszlás az elméleti (általános) forgalmazása.
fit teszt válaszolni a kérdésre, hogy a különbség a minta és az elméleti eloszlás olyan kicsi, hogy annak tudható be, hatása véletlenszerű tényezők, vagy sem.
Hagyja, hogy a törvény a népesség megoszlása nem ismert, de van okunk azt hinni, hogy van egy bizonyos fajta.
1) Ha a feltételek a központi határeloszlás-tétel, van ok azt feltételezni, hogy az általános elosztás - normális;
2) Amennyiben a minta azt jelenti, és a minta szórásnégyzet egyenlő, akkor feltételezhető, hogy az általános népesség Poisson eloszlás, stb
Ezek a megállapítások hipotézisek és alá kell vetni a statisztikai vizsgálatok.
A hipotézis tesztelésére. forgalmazás törvény az ilyen típusú (normál, egyenletes, exponenciális), speciálisan kiválasztott valószínűségi változó, amely az úgynevezett feltétel hozzájárulását.
Az illeszkedési egy kritérium vizsgálata a hipotézist a javasolt törvény ismeretlen eloszlás.
Számos jóváhagyási kritériumokat:
- (Chi-négyzet) Pearson, Kolmogorov kritérium Mises - Smirnova et al.
8.1 A kritériuma Pearson.
Vegyük azt az esetet, amikor a minta közel voltak a statisztikai intervallumot. Ahhoz, hogy tanulmányozza az X valószínűségi változó, N- végzett kísérleteket, a tartományban megfigyelt adatokból az X változó van osztva q időközönként. elosztási szám: