A statisztikai hiba eredményeinek kultúra és reprezentáció az adatok marketing, laboratóriumi

előző ◈ a következő

Marketing Magyarország - egy viszonylag új alkalmazott tudomány. Itt alapvetően fut képviselői „rokon” szakmák - szociológusok, pszichológusok, közgazdászok, stb

Keverés szakmai kultúrák akadályozza a fejlődését a saját kultúra piackutatás (a továbbiakban - MI) és az eredmények bemutatása, amely alapján az ügyfél kutatás döntéseket hozni, és az üzletmenet.

Tekintsük különszám a statisztikai hiba mennyiségi MI és hogyan jelenléte miatt a hiba célszerű bemutatni az eredményeket.

Kvantitatív (vagy statisztikai) mérjük különböző paramétereket a piackutató szerez kifejezett eredményeket számok - százalék, értékelés, stb Ezek a számok kiadott, a táblázatok formájában a rendszer, menetrendek, stb kíséri a következtetéseket és ajánlásokat benyújtják az ügyfél.

Van egy probléma, valószínűleg nem ismert, hogy az ügyfél, de amelyekre a kutató tudni.

Minden bemutatott adatok a jelentés - csak egy becsült paraméter mért kutatók által ezek alapján a statisztikai mérések. Elvének vizsgálata nem pontos, ha csak azért, mert ez az úgynevezett „Statisztikai hiba” (elvileg az adatok más típusú hibák, például a kapcsolódó kutató hibák a tervezés és szervezés a vizsgálat folyamatban, nem helytálló kijelentés a probléma, ezért nem látjuk őket itt).

Más szóval, mivel a számadatokat a%.

Természetesen minél minta értékeinek statisztikai mérést, annál kisebb a statisztikai hiba.

A kutató egy profi, így valószínűleg tisztában értékének statisztikai hiba által benyújtott adatok az ügyfél. Kutató jelentés szerint általában a statisztikai hiba értékét.

De az ügyfél nem tudja, ami azt jelenti, ezek a kutatók a statisztikai hiba, és ami a legfontosabb, hogy ez a hiba, mert azt venni a tervezés jövőbeli tevékenysége.

Az alábbiakban tekintsünk két alapvető kérdésre:

Statisztikai mérési hiba. (Főleg a szakemberek).
Amint helyesen képviseli az ügyfelek adatait a rendelkezésre álló mennyiségi statisztikai hiba.

Példa. Töredéke jelentést morbiditási statisztikákat a lakosság Moszkva.

Kérdés: „Nem volt az influenza mostanában?”

A vezető a minta felmérés válaszok az alábbiak voltak (abszolút számok):

Ill influenza az elmúlt.

Nagysága a statisztikai hiba

Tegyük fel, hogy szeretné megbecsülni egy paraméter p piacon. Ebből a célból, végzünk statisztikai mérés a mintán n.

Megjegyezzük, hogy a p szám teljesen pontos értékét a kívánt paramétert, amit nem tudom, és nem lehet elvileg ismert, de meg kell becsülni a statisztikai mérések.

Megbízhatósági szint és a megfelelő intervallum

A statisztikai mérés érhetünk becsült p * mi ismeretlen paraméter p.

A becslés p * lesz valahol közel a valódi értéke a p paraméter. és valószínűleg nem lesz pontosan megegyezik p.

Az elosztó a lehetséges értékek az értékelés értékei az ismeretlen paraméter f (p *). Azt állítja, általában normális (Gauss) jog - 1. ábra.

1. ábra.

Itt = 3,14159.

- az úgynevezett szórás (RMS) érték, függ mintanagyság n. minél nagyobb a minta, annál kisebb az eltérés.

Által határolt területen egy Gauss-görbe, és egy vízszintes tengely, egyenlő 1.

Fontolóra A százalékos% a görbe alatti terület közelében, a p-tartományban x a p-p + x. (Ábra. 2)

Valószínűséggel% A kapott becsült p * lesz a tartományban x a p-p + x.

És a valószínűsége% hívják megbízhatósági szint mellett. Azt mondják, a valószínűség A% a becsült p * lesz a közötti alsó határa p-x és egy felső határ közelében, a p + x p.

Vagy rövidített formában - "p% x".

Elfogadva normál érték megbízhatósági szint A = 95%. Ebben az esetben mi intervallum határait közel lesz a p% 2. Vagy - p% 2 (3.ábra).

hitelesség

Az előző részben az volt a kérdés, hogy hol a következő valódi értéke p paraméter lehet a becsült p *.

Az életben - éppen ellenkezőleg. Nem tudjuk, hogy a valódi értékét p. de miután a statisztikai mérések azt látjuk, a becsült p *.

A kérdés, hogy a hiba a mi becslés az alábbiak szerint történik: mi az intervallum p *. amely lehet (A% -os valószínűséggel), a valódi értékét a p paraméter?

Más szóval, p% mennyi? Egy adott minta n.

Tekintsük ezt a kérdést.

Tehát, megvan a becslés p *. Megvan a jogot, hogy terjesszen elő egy hipotézis: „az igazi értéke a p paraméter p1 (4. ábra).” A hipotézis: „az igazi értéke a p paraméter p2” vagy „a valódi értéke a p paraméter p3”, lásd a 4. ábrát.

HITELESSÉG hipotézisek a valódi értéke a p paraméter a feltételes valószínűsége, hogy megkapjuk a becsült p *. ha valóban az igazi paraméter értéke egyenlő p.

Más szóval, azt feltételezzük, hogy tudjuk, hogy a p paraméter (feltétel). És nézzük meg, mi van a feltételes valószínűsége értékelés * p:

Tényleges értéke p nem tudjuk. Feltesszük (feltételez), hogy például, ez egyenlő p1. Hadd emlékeztessem önöket, mi végzett statisztikai mérést, kapott több p * a becsült paraméter p.

A feltételes valószínűsége, hogy a feltételezett érték p1 látogató becslésünk p *. Más szóval, az elfogadhatóságát a hipotézist p1. Más szavakkal, W (p * | p), az - 5. ábra.

Szigorúan véve, a valószínűsége a görbe alatti terület a 5. ábra. így a valószínűsége, hogy az adott értékelés alapján a hipotézist p * p1 végtelenül kevés.

De ez a szám még mindig kevesebb, mint a valószínűsége, hogy a becslés p *. Ha elfogadjuk azt a feltételezést, p3 = p *. (6. ábra)

Kényelmes használat a valószínűsége arány.

Feltéve, hogy a számláló és a nevező a végtelenül mennyiségben, likelihood arány fajlagos értéke nem nulla, ami annak a valószínűségét arány nagyon praktikus többféle célra.

A mi esetünkben, a legvalószínűbb hipotézis, hogy a valódi értékét a p paraméter megegyezik a becsült p *. Azonban egy nagyon hihető hipotézist, hogy az igaz, de számunkra ismeretlen, a paraméter értékét p egy kicsit több, vagy egy kicsit kevesebb, mint p *.

Keresse meg a számértéket a határ valószínűség aránya. Ha a valószínűsége aránya a hipotézis kisebb ez a szám, a hipotézis tekinthető egészen elfogadható, ha több - valószínűtlen.
Alapján a valószínűsége aránya határozza meg a statisztikai hiba értékelési intervallum p * egy adott mintában.
Mi határozza meg a határ értékei a valószínűségi hányados standard bizalom valószínűsége A = 95%. (2. ábra)

Határ likelihood-arány megfelelő intervallum határát közel p *. (Nevezzük őket RGR), a felső és alsó, amelyek meghatározzák a különböző statisztikai pontossága a becsült p *.

Határ valószínűségi arány

Hitelesség a RGR. W (p * | p = RGR)

Határ valószínűségi arány (az A = 95%):

Tehát, egy intervallum, amelyen belül, közel p *. alatt bizalmat valószínűsége A = 95%. Ez lehet az igazi paraméter értékét p. más szóval - statisztikai mérési hiba intervallum jellemzik a következő szabály:
A határokat ezen intervallum egyenlő az arány a valószínűségek 7,4; intervallumon belül - a kevesebb - több mint 7,4.

Számítási hiba intervallum

Minta mérete, visszahívás, n.

Tegyük fel, r ezek alkalmasak körülményeknek.

Ha a teszt p paraméter egy elegendően nagy értékű, azaz a tartományban 5-95%, a lehetséges értékei p * becslései esetében a binomiális törvény. A határokat az intervallum a statisztikai hiba van a következő egyenlet:

Megoldása numerikus módszer, kiszámítjuk az intervallum a statisztikai hibahatár minden értéke p *. feküdt a tartományban 5-95%, a különböző n-ekre.

Ha a vizsgált paraméter p kicsi, a tartományban legfeljebb 5%, a Poisson törvény vonatkozik:

A számítások eredményei alsó és felső határait időközönként bármely statisztikai hiba becslések p * értékek n különböző mintákat az alábbiakban mutatjuk be grafikonok ábrán. 8.

1. A grafikon azt mutatja, a számos lehetséges értékei p * 0% -ról 50%, hogy helyet. Grafikonok szimmetrikus a vonal a 50%.

A hiba becslése (felső és alsó határai intervallumok), például p = 60% az a hiba (rendre az alsó és a felső határokat a intervallumok) becslése p = 40%.

2.Chem kevesebb, mint a becsült p *. annál kisebb a hiba mérések. A maximális mérési hiba becslése lesz a régióban 50%. A további növekedés a hiba kiértékelési érték statisztikai mérés ismét csökken.

3. Interval aszimmetrikus hiba. Például, ha n = 100 mintavételi képernyő és becslést a p paraméter = 30% hiba tartományban lesz 8,30-30% + 9%.

Példa. (Folytatás)

A fenti táblázatban, add oszlopok, ahol:

Számítási eredmények a relatív gyakoriság válaszok redukálható% -ban kifejezve a következő képlettel (1), kerekítve az első tizedes helyen.
A határait a bizonytalansági intervallum minden számjegy (alapján 8. ábra grafikonok.).
Az értékek a bizonytalansági intervallum.

Ill influenza az elmúlt.

Megjegyezzük, a következő tényeket:

A statisztikai hiba e mérések (mintavételezett 401) úgy, hogy azt egyedileg azonosítja a különbség a frekvenciák válaszok „2 hét”, „1 hónap” és „2 hónap”. Interval hibahatáron ezekre adott válaszok nem fedik egymást.
A statisztikai hiba a mérések nem egyedileg azonosítja a különbségeket frekvenciameneteit „1 hónap”, „3 hónap” és a „hat hónap”.

Más szóval, az adatok alapján bemutatott, arra lehet következtetni, hogy „azok, akik az influenza az elmúlt 3 hónapban több mint azok, akik az influenza az elmúlt 1 hónapban.” De ez a következtetés megbízhatatlan.

Mérési bizonytalanság és az eredmények bemutatása

A gyakorlatban gyakran előfordul, hogy a minta mérete - nem kerek számot, a számítást a becslésére paraméter p * általános képletű:

az is lehet, hogy a becslés p * nem lesz túl „kényelmes”:

Hogyan kell helyesen kerek az eredmény?

Fontolja meg, hogy az eredmények a kerekítési probléma megoldására mérnökök.

Tegyük fel, hogy egy bizonyos mért feszültség egy bizonyos hálózati hozzáférés voltmérő eredmény látható: A 36.3

Azonban bármilyen eszköz nem tökéletes, azaz a annak értéke pontatlan, van egy hibahatár. Az érték az egység hiba általában az útlevélbe, és a panel.

Ha a voltmérő egy hiba ± 1 V, akkor a mérési jegyzőkönyv mérnök ír egy szám: 36

Így, egy mérnök leolvasott kerekíti a legközelebbi 1 összhangban pontossággal értékelése a készülék.

Más szóval, a protokoll tárolt mérési eredmény kerekítve az utolsó érvényes számjegyet.

Pontosság eszköz -1 + B, tehát tíz számjegyet 36,3 megbízható, egység - hiteles, és tized volt - megbízhatatlan. Hiba az eszköz nem lehet mérni tized.

Ezért tized kerekítve 1 - összhangban a szabályokkal kerekítik.

Ha a voltmérő van mérési hiba ± 0,5, majd, miután megkapta az eredménye 36,3 V mérési jegyzőkönyv, fel kell hívnunk 36,5 V.

Küldje a mérési jegyzőkönyv csak megbízható adatok - úgy értendő helyességét mennyiségi bármilyen típusú adat.

A „műszer” - kvantitatív statisztikai mérések. Pontossága a készülék függ a minta nagysága - ld .. 8.

Szakmai kultúra megköveteli, hogy csak megbízható eredményeket a jelentésben bemutatott:

Példa. (Folytatás)

A végleges formáját a táblázat a jelentésben, az ötlet matematikailag helyes eredmények:

Ill influenza az elmúlt.

Figyelem! Ha a kerekítés eredményei azt kell szem előtt tartani: előfordulhat, hogy az összeg az összes számot nem lesz egyenlő 100,0% (az utolsó sort a táblázatban).

megállapítások 1. csoport

következtetések 2. csoport

Ha közben a mennyiségi méréseket meg van elégedve a pontossága + -10%, használjon minta nagysága 100: növeljük a minta kétszer semmi új akarat, kivéve talán a költségvetés növelését.
Hasonlóképpen, a kívánt pontossága + -5% elegendő minta körülbelül 350. A kétszeres megnövelt mintára nem hoz jelentős eredményeket.
Végrehajtásához precíziós (különösen pontos) statisztikai mérést - legfeljebb 0,1% - a minta szükséges, legalább 15-20 ezer.
Ha a kutató a nyilatkozat kvantitatív statisztikai mérések azt mutatják, számok tized%, és az alapján tized% teszi bizonyos következtetéseket, akkor a legvalószínűbb, hogy meghamisítja.

Matematikailag korrekt képviselete az adatokat a jelentés nem szünteti meg annak szükségességét, hogy külön-külön fel kell tüntetni a statisztikai hiba a statisztikai mérések.

Irodalom:

lásd még

Kapcsolódó cikkek

előző ◈ a következő