Simpson-paradoxon 1

Simpson-paradoxon (paradoxon Yule-Simpson, kombinálásával paradox) - hatás jelenség a statisztikát, amikor a jelen két csoport adatait, amelyek mindegyike azonos irányított kapcsolat figyelhető meg, ha kombinálja ezeket a csoportokat függően az irány megfordul.

Története felfedezése paradoxon

példa chipek

Tegyük fel, hogy van négy kalapok (két fekete és két szürke), 41 chip (23 színes és 18 fehér) és két asztal (A és B). Chipeket elosztva a kalapok a következők szerint:

  • A fekete kalap egy asztalra Egy 5 és 6 fehér színű zsetont.
  • A szürke kalap az asztalon A 3 és 4 fehér színű zseton.
  • A fekete kalap az asztalon B 6 és 3 fehér színű zsetonnal.
  • A szürke kalap az asztalon B 9 és 5 fehér színű zsetont.

Tegyük fel, hogy szeretnénk, hogy egy szín chip.

Ha az asztalnál egy, annak a valószínűsége, hogy a színt chip fekete kalap 11/05 = 35/77. és a szürke kalapok ugyanannál az asztalnál - 3/7 = 33/77; így színes chipek több esélye, hogy húzza ki a fekete kalap, mint szürke.

Ha az asztal körül B, akkor annak a valószínűsége, hogy a színt chip fekete kalap egyenlő 6/9 = 28/42. és a szürke kalap - 14/09 = 27/42; ezért itt színű zsetont több esélye, hogy húzza ki a fekete kalap, mint szürke.

Tegyük fel most, hogy a chipek a két fekete kalapot hajtva egy fekete kalap egy asztalra B és két szürke chips kalapok - egy szürke kalapot az asztalra B. Első pillantásra logikus lenne azt feltételezni, hogy a valószínűsége, rajz színes darab fekete kalap magasabb, mint a kén. De ez nem igaz:

  • a valószínűsége, rajz egy színes darab fekete kalap egy asztalon B 11/20 = 231/420,
  • a valószínűsége, hogy a rajz egy színes darab szürke kalap az asztalra egyenlő 12/21 = 240/420,

azaz annál nagyobb az esély, hogy a színt chip szürke sapka, mint a fekete. [4]

példa kövek

Tegyük fel, hogy négy készlet kövek. Annak a valószínűsége, a rajz egy fekete kő meghatározott №1 magasabb, mint egy sor №2. Másfelől, a valószínűsége rajz egy fekete kő meghatározott №3 több, mint egy sor №4. Összefogás meghatározott №1 egy sor №3 (így a készlet I), a set №2 - egy sor №4 (Set II). Ösztönösen, akkor várható, hogy a valószínűsége, rajz egy fekete kő a készletben magasabb, mint a beállított II. Általában azonban, hogy ez nem igaz.

Egy matematikai bizonyítás. Legyen n i> - száma fekete kövek a i -edik beállított (minta), m i> - teljes száma kövek az i -edik beállított i = 1. 2. 3. 4.. Azzal a feltétellel:

Annak a valószínűsége, a rajz egy fekete kő, a készletek I., illetve II:

A kifejezés a sor én nem mindig jobb kifejezés a beállított II. Például: n 1 = 6 m 1 = 13. N 2 = 4 m 2 = 9. n 3 = 6. m 3 = 9. n = 9. m 4 = 14 4 = 6,

Az arány a súlyozott száma visszanyert nem tért vissza közé nem figyelembe a gyógyszert ebben az esetben 0,685, ami alacsonyabb, mint, hogy figyelembe a gyógyszert. Ez kiküszöböli a paradoxon és arányát mutatja behajtott nem hajtott nélkül gyógyszert ugyanolyan arányban a férfiak és a nők, mint hogy a gyógyszert, amely lehetővé teszi, hogy hasonlítsa össze ezeket a számokat.

Kapcsolódó cikkek