Csalás segítségével statisztika - paranormális antológiák
Beszéljünk arról, hogy hogyan megtéveszteni minket használatával statisztikák és a tények, és nézd meg, hogyan, hogy ne essen áldozatul a csalások és a pszeudo
Tedd fel a bőr a hazug, aki használni fogja a legegyszerűbb és leghatékonyabb módszerek bemutatása adatokat meglehetősen ártalmatlan, hogy vágyálom.
hibás mintavétel
Tegyük fel, hogy szeretné elvégezni a kutatást globális szinten, és ezért válassza az emberek az egész világon. Tegyük fel, hogy van egy lista az összes ember a bolygón, és véletlenül kap belőle 10 fő, akik válaszolnak a kérdésekre. Majd a kutatás viseli legalább bizonyos értelemben? Alig. A fő hiba az, hogy még akkor is, válassza az emberek véletlenszerűen, számuk túl kicsi volt, hogy tanulmányozza volt legalább néhány érték. Ez nagyon könnyen lehet, hogy mind a 10 ember olvasott, vagy éppen ellenkezőleg, egyetlen válaszadó sem veszi könyveket a kezében. Ebben az esetben az eredményt a kutatás is arra a következtetésre jutott, hogy minden ember folyamatosan olvas, vagy hogy egyik embert nem érdekli az olvasás. Nem a leginkább informatív vizsgálat, nem?
A statisztikák szerint 100% látogatók könyvtárak olvasni.
Azonban, még ha veszel egy mintát 10 millió ember, még mindig nem garantálja a pontos eredményeket. Mondjuk, néhány évvel ezelőtt, akkor végeztek egyes felmérések és közvélemény-kutatások csak 10 millió különböző tudósok a világ minden tájáról. Helyesen kell használni ezt a mintát? Egyrészt, ez nagyon nagy, de másrészt, ez a leginkább, hogy sem egy elfogult mintát. Értékeljük, hogy az emberiség szeret olvas, hány tudós olvasni - ez olyan, mint kell megítélni, milyen százalékban foglalkozik a kézi munka, interjú kizárólag vízvezeték-szerelők.
hogy az átlagos
Képzeljük el, hogy azt szeretné, hogy a cég X és érdekli az átlagos fizetés a cégnél. Érdekli a megállapítás jelentés, akkor tudni fogja, hogy ez 100 $ 000 évente, de mit jelent ez pontosan? Lehet, hogy ez mennyit fog fizetni után azonnal a munkát? Nem. Talán egy bizonyos idő után a munka ez a társaság, akkor nagy valószínűséggel kap ez az összeg? Egészen. Tehát mit jelent ez? Tény, hogy egy gyakorlati szempontból, semmi, ha a vizsgálat a pontosabb mi az átlagos kérdéses.
A kifejezés „az átlagos hőmérséklet a kórházban” van egy ironikus hangot pontosan azért, mert a számtani átlag hőmérséklet a betegek azt mondják, hogy ezek mind egészséges.
Az a tény, hogy három átlagok: számtani átlag, medián és mód. Abban az esetben, számtani közép összeadja az összes értéket, és összegét elosztjuk a száma szempontjából. Medián azt jelenti, hogy a felét érték alatt van ez az érték, és fél felett. Divat egyszerűen leírja a leggyakoribb érték a készlet.
Most nézzük meg, hogy miért a kifejezés az átlagkereset alatt számtani átlaga értelmetlen. Tegyük fel, hogy a vállalat alkalmaz a vezérigazgató a fizetése 10 millió $, 5 menedzserek fizetése 300 $ 000 és 20 munkavállaló a fizetése 75 ezer dollár. A számtani átlaga a következőképpen állítjuk elő: (10 000 000 x 5 + 300 000 + x 20 75 000) / (1 + 5 + 20) = 500 000 dollárt. Annak ellenére, hogy a leggyakoribb fizetést (és a legvalószínűbb, akkor kap pontosan) egyenlő 75.000, az átlagkereset a cég eléri a 500 000, bár tény, hogy nem kap egy.
Ebben az esetben, ha igazán akarjuk, hogy értékelje a pénzügyi kilátások a cég, a legésszerűbb, hogy vizsgálja meg a kutatás, ahol a medián vagy akár a divat, de semmi esetre sem a számtani átlagát bérek. Igen, valószínűleg ez a szám úgy néz ki, látványos, de le a földre, vagy medián mód tükrözi a valóságot, és képes legyen kapsz útmutatást, amikor kiválasztják a valódi munka.
hűvös grafika
Képzeljük el a következő helyzetet: te, aki egy grafikon, amely a jövedelem Roman Abramovics az elmúlt évben, és szeretné bemutatni a társaság bevételét, hogy azok jobban néznek ki, mint a jövedelem híres milliárdos.
Első pillantásra úgy tűnik, egy lehetetlen feladat, de ez valójában nagyon egyszerű. Elég, ha változtatni a skála a diagram a Y tengellyel Más szóval, ha az érték a függőleges a grafikonon Abramovics bevételek több tízmillió dollárt, hogy azok egyenlő tíz dollárt. Ez fogja elérni a kívánt hatást.
Azonban van egy egyszerűbb módja: távolítsa el a skála az Y tengely egyáltalán. Ez lehetővé teszi, hogy dolgozzon egy grafikon ilyen robbanásszerű növekedése, azzal, amit szeretnék.
Grafika - szórakoztató, de gyakran teljesen nem informatív.
Válassza ki a megfelelő kutatási
Mivel fantasztikus lenne, mint amilyennek hangzik, de a segítségével a statisztikák könnyen bizonyítani, hogy az érme esik farok 100% -ában. Ezen felül, ezt el lehet érni akár független szakértői laboratóriumi adatok (az ismerős megfogalmazás?). A lényege a kísérlet a következő: hagyja, hogy a laborban csak rendezni egy érme 5-ször. Tekintettel arra, hogy minden egyes alkalommal, amikor esik egy sas, akkor megállapíthatjuk, hogy a sas esik esetek 100% -ában. Mi a trükk? Az a tény, hogy valójában felvenni több tucat laboratóriumok, amelyek mindegyike ugyanolyan volt: dob egy érme 5-ször. Ezután csak ki kell választanod a laboratórium, amely fog dobni egy érmét, ahogy kell.
Ha úgy gondolja, hogy a való életben, mint trükk nem kell alkalmazni, felidézni a különböző feliratokat termékek a stílusa „fogkrém vált 25% -kal hatékonyabb, mint korábban,” vagy „új port távolítja el a szennyeződéseket 30% -kal jobb, mint a hagyományos por.” Ebben az esetben általában van egy jegyzet „bizonyult független laboratórium által.” Úgy érzi, ha szorít a cipő?
Trükkök vizualizációs
Képzeljük el, hogy a vállalat dolgozói keres 100 $ egy nap, és a B vállalat csak 50. Ha egy társaság és a tulajdonosok, és azt szeretnék, hogy vonzzák az új alkalmazottak, azt szeretnénk, hogy maximálisan kihasználja azt a tényt, hogy a dolgozók keresnek kétszer annyit, mint a versenytárs munkavállalóit. Akkor egyszerűen felhívni a grafikon, amely az oszlop „fizetés Company A„egy 2-szer magasabb, mint a vállalat a B oszlopban
De lehet, hogy a megjelenítés még látványosabbá. Focus One: Y tengely a grafikon nem 0-val kezdődnek, és például a 30 $. Így a vizuális különbség nem az, hogy a 2-szer, és minden 3.5. Kétségtelen, hogy elkezdhetjük építeni, és 40 $ - akár 6-szor a különbség fog kinézni még jelentősebb.
Ezen kívül lehetőség van felhívni a zsákok egy dollár jelet rájuk, mint a megszemélyesítője a pénz, és a különbségből adódik használja őket. Egyrészt, a cég A2 megfelel a táska $ 50 és B vállalat csak 1. De ismétlem, ez nem elegendő hatékonyan. Nézzük jobban felhívni a táskát, amely tükrözi fizetés cég részére, kétszer nagyobb, mint a megfelelő táska Company B.
A trükk az, hogy ahelyett, hogy egyre nagyobb területen a táska 2-szer (ha beszélünk egy kétdimenziós kép a zsák), növeljük mindkét oldalon 2-szer. Így a vizuális különbség kapott 4-szeres. Természetesen, ha azt szeretnénk, hogy egy háromdimenziós változata a szemléltetés, a különbség eléri a 8-szor.
Komplex ok-okozati kapcsolatok
Tegyük fel, hogy egy iskolapszichológus rendelt közötti összefüggés vizsgálatára a dohányzás és a tanulói teljesítmények. A pszichológus tanulmányozta a megfelelő adatokat kapja meg: többek között a jó tanulók gyermekek nem dohányzik, míg a dohányzás között alulteljesítő mindent. Ez azt jelenti, hogy a dohányzás károsan befolyásolja a tanulási folyamatban? Nem az a tény.
Az a tény, hogy még nem jött el, mi az oka, és hogy - a vizsgálat során. Egyrészt, a dohányzás lehet oka a gyenge tanulók teljesítményét. De másfelől, akkor könnyen lehet, hogy mit kitolja a gyenge teljesítmény a diákokat, hogy váljon a dohányosok.
Ebben az esetben van dolgunk, a korreláció (két változó közötti kapcsolat), de az összefüggés - nem ok-okozati összefüggés. Az első helyen, nem mindig világos, hogy mi az ok és hatás, másrészt a korreláció bármelyik érték nem mindig és minden gyakorlati értelme.
hibák
Nagyon fontos figyelni, hogy hiba történt a kutatás. Képzeld el, hogy szeretné mérni a területen, amelynek hossza 100 méter (de nem tudom). Minden lépés szedése egyenlő körülbelül 1 méter, de 100 méter, akkor lehet, hogy tévedek, hogy három méter. Más szóval, mérési területen, akkor megállapíthatjuk, hogy ez megegyezik a hossza és a 97 és 99, és még 103 méter. Ebben az esetben, a hiba egyenlő 3%.
Nézzünk egy példát, ahol az elhanyagolása a tanulmány számításai hiba vezethet abszurd eredményeket. Egy jól ismert teszt mérésére Stanford-Binet IQ a hiba a mérési eredményeket a 3%.
Most képzeljük el, hogy a gyermek volt az eredménye, egy 97 pont, míg a gyermek B - 103. Tekintettel arra, hogy a 100 pont - az átlagos (vagy „normális”), kiderül, hogy az eredmény a gyermek az átlag alatti, és a gyermek B - átlag feletti. Azonban, ha arra gondolunk, hogy a mérési hiba a 3% -os könnyen megtörténhet, hogy valóban a gyermek Eredményes 103 pontot, és a gyermek B, éppen ellenkezőleg, 97. Ezért azt mondani, hogy a gyermek okosabb And B, amely a IQ-teszt (amely általában az abszurd), - nem a legjobb ötlet.
következtetés
Megvizsgáltuk csak a leggyakoribb módszerek adatkezelés segítségével statisztikákat. Azonban, ha azt szeretnénk, hogy továbbra is vizsgálja ezt a témát, ajánlom a könyvet „Hogyan hazudni segítségével statisztika.”
A legfontosabb dolog - ne hagyja ismeretek elméleti síkon. Legközelebb, ha megnézzük egy másik tanulmány, illetve az (különösen, ha ez fog összpontosítani a munkát, amelyet az elnök az elmúlt négy év), próbálja megközelíteni az ügyet szkeptikusabb, és megtudja, hogy miről szól és milyen eredményeket értem.