A statisztikai hiba eredményeinek kultúra és reprezentáció az adatok marketing, laboratóriumi
Marketing Magyarország - egy viszonylag új alkalmazott tudomány. Itt alapvetően fut képviselői „rokon” szakmák - szociológusok, pszichológusok, közgazdászok, stb
Keverés szakmai kultúrák akadályozza a fejlődését a saját kultúra piackutatás (a továbbiakban - MI) és az eredmények bemutatása, amely alapján az ügyfél kutatás döntéseket hozni, és az üzletmenet.
Tekintsük különszám a statisztikai hiba mennyiségi MI és hogyan jelenléte miatt a hiba célszerű bemutatni az eredményeket.
Kvantitatív (vagy statisztikai) mérjük különböző paramétereket a piackutató szerez kifejezett eredményeket számok - százalék, értékelés, stb Ezek a számok kiadott, a táblázatok formájában a rendszer, menetrendek, stb kíséri a következtetéseket és ajánlásokat benyújtják az ügyfél.
Van egy probléma, valószínűleg nem ismert, hogy az ügyfél, de amelyekre a kutató tudni.
Minden bemutatott adatok a jelentés - csak egy becsült paraméter mért kutatók által ezek alapján a statisztikai mérések. Elvének vizsgálata nem pontos, ha csak azért, mert ez az úgynevezett „Statisztikai hiba” (elvileg az adatok más típusú hibák, például a kapcsolódó kutató hibák a tervezés és szervezés a vizsgálat folyamatban, nem helytálló kijelentés a probléma, ezért nem látjuk őket itt).
Más szóval, mivel a számadatokat a%.
Természetesen minél minta értékeinek statisztikai mérést, annál kisebb a statisztikai hiba.
A kutató egy profi, így valószínűleg tisztában értékének statisztikai hiba által benyújtott adatok az ügyfél. Kutató jelentés szerint általában a statisztikai hiba értékét.
De az ügyfél nem tudja, ami azt jelenti, ezek a kutatók a statisztikai hiba, és ami a legfontosabb, hogy ez a hiba, mert azt venni a tervezés jövőbeli tevékenysége.
Az alábbiakban tekintsünk két alapvető kérdésre:
- Statisztikai mérési hiba. (Főleg a szakemberek).
- Amint helyesen képviseli az ügyfelek adatait a rendelkezésre álló mennyiségi statisztikai hiba.
Példa. Töredéke jelentést morbiditási statisztikákat a lakosság Moszkva.
Kérdés: „Nem volt az influenza mostanában?”
A vezető a minta felmérés válaszok az alábbiak voltak (abszolút számok):
Ill influenza az elmúlt.
Nagysága a statisztikai hiba
Tegyük fel, hogy szeretné megbecsülni egy paraméter p piacon. Ebből a célból, végzünk statisztikai mérés a mintán n.
Megjegyezzük, hogy a p szám teljesen pontos értékét a kívánt paramétert, amit nem tudom, és nem lehet elvileg ismert, de meg kell becsülni a statisztikai mérések.
Megbízhatósági szint és a megfelelő intervallum
A statisztikai mérés érhetünk becsült p * mi ismeretlen paraméter p.
A becslés p * lesz valahol közel a valódi értéke a p paraméter. és valószínűleg nem lesz pontosan megegyezik p.
Az elosztó a lehetséges értékek az értékelés értékei az ismeretlen paraméter f (p *). Azt állítja, általában normális (Gauss) jog - 1. ábra.
1. ábra.
Itt = 3,14159.
- az úgynevezett szórás (RMS) érték, függ mintanagyság n. minél nagyobb a minta, annál kisebb az eltérés.
Által határolt területen egy Gauss-görbe, és egy vízszintes tengely, egyenlő 1.
Fontolóra A százalékos% a görbe alatti terület közelében, a p-tartományban x a p-p + x. (Ábra. 2)
Valószínűséggel% A kapott becsült p * lesz a tartományban x a p-p + x.
És a valószínűsége% hívják megbízhatósági szint mellett. Azt mondják, a valószínűség A% a becsült p * lesz a közötti alsó határa p-x és egy felső határ közelében, a p + x p.
Vagy rövidített formában - "p% x".
Elfogadva normál érték megbízhatósági szint A = 95%. Ebben az esetben mi intervallum határait közel lesz a p% 2. Vagy - p% 2 (3.ábra).
hitelesség
Az előző részben az volt a kérdés, hogy hol a következő valódi értéke p paraméter lehet a becsült p *.
Az életben - éppen ellenkezőleg. Nem tudjuk, hogy a valódi értékét p. de miután a statisztikai mérések azt látjuk, a becsült p *.
A kérdés, hogy a hiba a mi becslés az alábbiak szerint történik: mi az intervallum p *. amely lehet (A% -os valószínűséggel), a valódi értékét a p paraméter?
Más szóval, p% mennyi? Egy adott minta n.
Tekintsük ezt a kérdést.
Tehát, megvan a becslés p *. Megvan a jogot, hogy terjesszen elő egy hipotézis: „az igazi értéke a p paraméter p1 (4. ábra).” A hipotézis: „az igazi értéke a p paraméter p2” vagy „a valódi értéke a p paraméter p3”, lásd a 4. ábrát.
HITELESSÉG hipotézisek a valódi értéke a p paraméter a feltételes valószínűsége, hogy megkapjuk a becsült p *. ha valóban az igazi paraméter értéke egyenlő p.
Más szóval, azt feltételezzük, hogy tudjuk, hogy a p paraméter (feltétel). És nézzük meg, mi van a feltételes valószínűsége értékelés * p:
Tényleges értéke p nem tudjuk. Feltesszük (feltételez), hogy például, ez egyenlő p1. Hadd emlékeztessem önöket, mi végzett statisztikai mérést, kapott több p * a becsült paraméter p.
A feltételes valószínűsége, hogy a feltételezett érték p1 látogató becslésünk p *. Más szóval, az elfogadhatóságát a hipotézist p1. Más szavakkal, W (p * | p), az - 5. ábra.
Szigorúan véve, a valószínűsége a görbe alatti terület a 5. ábra. így a valószínűsége, hogy az adott értékelés alapján a hipotézist p * p1 végtelenül kevés.
De ez a szám még mindig kevesebb, mint a valószínűsége, hogy a becslés p *. Ha elfogadjuk azt a feltételezést, p3 = p *. (6. ábra)
Kényelmes használat a valószínűsége arány.
Feltéve, hogy a számláló és a nevező a végtelenül mennyiségben, likelihood arány fajlagos értéke nem nulla, ami annak a valószínűségét arány nagyon praktikus többféle célra.
A mi esetünkben, a legvalószínűbb hipotézis, hogy a valódi értékét a p paraméter megegyezik a becsült p *. Azonban egy nagyon hihető hipotézist, hogy az igaz, de számunkra ismeretlen, a paraméter értékét p egy kicsit több, vagy egy kicsit kevesebb, mint p *.
- Keresse meg a számértéket a határ valószínűség aránya. Ha a valószínűsége aránya a hipotézis kisebb ez a szám, a hipotézis tekinthető egészen elfogadható, ha több - valószínűtlen.
- Alapján a valószínűsége aránya határozza meg a statisztikai hiba értékelési intervallum p * egy adott mintában.
- Mi határozza meg a határ értékei a valószínűségi hányados standard bizalom valószínűsége A = 95%. (2. ábra)
Határ likelihood-arány megfelelő intervallum határát közel p *. (Nevezzük őket RGR), a felső és alsó, amelyek meghatározzák a különböző statisztikai pontossága a becsült p *.
Határ valószínűségi arány
Hitelesség a RGR. W (p * | p = RGR)
Határ valószínűségi arány (az A = 95%):
Tehát, egy intervallum, amelyen belül, közel p *. alatt bizalmat valószínűsége A = 95%. Ez lehet az igazi paraméter értékét p. más szóval - statisztikai mérési hiba intervallum jellemzik a következő szabály:
A határokat ezen intervallum egyenlő az arány a valószínűségek 7,4; intervallumon belül - a kevesebb - több mint 7,4.
Számítási hiba intervallum
Minta mérete, visszahívás, n.
Tegyük fel, r ezek alkalmasak körülményeknek.
Ha a teszt p paraméter egy elegendően nagy értékű, azaz a tartományban 5-95%, a lehetséges értékei p * becslései esetében a binomiális törvény. A határokat az intervallum a statisztikai hiba van a következő egyenlet:
Megoldása numerikus módszer, kiszámítjuk az intervallum a statisztikai hibahatár minden értéke p *. feküdt a tartományban 5-95%, a különböző n-ekre.
Ha a vizsgált paraméter p kicsi, a tartományban legfeljebb 5%, a Poisson törvény vonatkozik:
A számítások eredményei alsó és felső határait időközönként bármely statisztikai hiba becslések p * értékek n különböző mintákat az alábbiakban mutatjuk be grafikonok ábrán. 8.
1. A grafikon azt mutatja, a számos lehetséges értékei p * 0% -ról 50%, hogy helyet. Grafikonok szimmetrikus a vonal a 50%.
A hiba becslése (felső és alsó határai intervallumok), például p = 60% az a hiba (rendre az alsó és a felső határokat a intervallumok) becslése p = 40%.
2.Chem kevesebb, mint a becsült p *. annál kisebb a hiba mérések. A maximális mérési hiba becslése lesz a régióban 50%. A további növekedés a hiba kiértékelési érték statisztikai mérés ismét csökken.
3. Interval aszimmetrikus hiba. Például, ha n = 100 mintavételi képernyő és becslést a p paraméter = 30% hiba tartományban lesz 8,30-30% + 9%.
Példa. (Folytatás)
A fenti táblázatban, add oszlopok, ahol:
- Számítási eredmények a relatív gyakoriság válaszok redukálható% -ban kifejezve a következő képlettel (1), kerekítve az első tizedes helyen.
- A határait a bizonytalansági intervallum minden számjegy (alapján 8. ábra grafikonok.).
- Az értékek a bizonytalansági intervallum.
Ill influenza az elmúlt.
Megjegyezzük, a következő tényeket:
- A statisztikai hiba e mérések (mintavételezett 401) úgy, hogy azt egyedileg azonosítja a különbség a frekvenciák válaszok „2 hét”, „1 hónap” és „2 hónap”. Interval hibahatáron ezekre adott válaszok nem fedik egymást.
- A statisztikai hiba a mérések nem egyedileg azonosítja a különbségeket frekvenciameneteit „1 hónap”, „3 hónap” és a „hat hónap”.
Más szóval, az adatok alapján bemutatott, arra lehet következtetni, hogy „azok, akik az influenza az elmúlt 3 hónapban több mint azok, akik az influenza az elmúlt 1 hónapban.” De ez a következtetés megbízhatatlan.
Mérési bizonytalanság és az eredmények bemutatása
A gyakorlatban gyakran előfordul, hogy a minta mérete - nem kerek számot, a számítást a becslésére paraméter p * általános képletű:
az is lehet, hogy a becslés p * nem lesz túl „kényelmes”:
Hogyan kell helyesen kerek az eredmény?
Fontolja meg, hogy az eredmények a kerekítési probléma megoldására mérnökök.
Tegyük fel, hogy egy bizonyos mért feszültség egy bizonyos hálózati hozzáférés voltmérő eredmény látható: A 36.3
Azonban bármilyen eszköz nem tökéletes, azaz a annak értéke pontatlan, van egy hibahatár. Az érték az egység hiba általában az útlevélbe, és a panel.
Ha a voltmérő egy hiba ± 1 V, akkor a mérési jegyzőkönyv mérnök ír egy szám: 36
Így, egy mérnök leolvasott kerekíti a legközelebbi 1 összhangban pontossággal értékelése a készülék.
Más szóval, a protokoll tárolt mérési eredmény kerekítve az utolsó érvényes számjegyet.
Pontosság eszköz -1 + B, tehát tíz számjegyet 36,3 megbízható, egység - hiteles, és tized volt - megbízhatatlan. Hiba az eszköz nem lehet mérni tized.
Ezért tized kerekítve 1 - összhangban a szabályokkal kerekítik.
Ha a voltmérő van mérési hiba ± 0,5, majd, miután megkapta az eredménye 36,3 V mérési jegyzőkönyv, fel kell hívnunk 36,5 V.
Küldje a mérési jegyzőkönyv csak megbízható adatok - úgy értendő helyességét mennyiségi bármilyen típusú adat.
A „műszer” - kvantitatív statisztikai mérések. Pontossága a készülék függ a minta nagysága - ld .. 8.
Szakmai kultúra megköveteli, hogy csak megbízható eredményeket a jelentésben bemutatott:
Példa. (Folytatás)
A végleges formáját a táblázat a jelentésben, az ötlet matematikailag helyes eredmények:
Ill influenza az elmúlt.
Figyelem! Ha a kerekítés eredményei azt kell szem előtt tartani: előfordulhat, hogy az összeg az összes számot nem lesz egyenlő 100,0% (az utolsó sort a táblázatban).
megállapítások 1. csoport
következtetések 2. csoport
- Ha közben a mennyiségi méréseket meg van elégedve a pontossága + -10%, használjon minta nagysága 100: növeljük a minta kétszer semmi új akarat, kivéve talán a költségvetés növelését.
- Hasonlóképpen, a kívánt pontossága + -5% elegendő minta körülbelül 350. A kétszeres megnövelt mintára nem hoz jelentős eredményeket.
- Végrehajtásához precíziós (különösen pontos) statisztikai mérést - legfeljebb 0,1% - a minta szükséges, legalább 15-20 ezer.
- Ha a kutató a nyilatkozat kvantitatív statisztikai mérések azt mutatják, számok tized%, és az alapján tized% teszi bizonyos következtetéseket, akkor a legvalószínűbb, hogy meghamisítja.
Matematikailag korrekt képviselete az adatokat a jelentés nem szünteti meg annak szükségességét, hogy külön-külön fel kell tüntetni a statisztikai hiba a statisztikai mérések.