Használata Bayes formula statisztikai következtetések

Orosz Állami Orvosi Egyetem

Vegyünk két példát.

PrimerN 1. Ismeretes, hogy abban az esetben, tuberkulózis radiográfiai lehetővé teszi a diagnózis 95% -ában (a vizsgálati eljárás érzékenysége = 95%). Ha a teszt is, a hibás diagnózis tuberkulózis kerül a másik 1% -ában (sajátossága a method = 100-1 = 99%). A betegek aránya a lakosság 0,5%. Mi a valószínűsége, hogy a vizsgált betegek, aki diagnosztizált tuberkulózis, tényleg beteg?

PrimerN 2. Az urna tartalmaz 5 golyó, amelyekről ismert, színük lehet fehér vagy fekete. Tól egy urna a visszatérő kinyert 4 golyó. Minden fekete volt. Mit lehet mondani, hogy hány fehér golyót?

E két példa van egy nagy különbség: az első - a helyes és egyszerű probléma valószínűségszámítás. Második - fogalmazott a régi kérdés, hogy a gyakorlatban az elmélet, mint a tapasztalatok alapján következtetést levonni arról az ismeretlen modell paramétereit (a szám a fehér golyó). Amire szükség van, hogy tisztázza, hogy az értelmét egy kérdés-válasz formában.

1.Formula Bayes egyszerű és könnyen származtatható.

Tegyük fel, hogy egy teljes csoport páronként diszjunkt események ismert valószínűségek. Bizonyos esemény szakszervezeti :. . A kérdéses események. amelyről ismert, hogy n feltételes valószínűségek. Ahhoz, hogy megtalálja a valószínűsége =? Figyeljük meg, hogy a feltétel és az esemény megfordul. A régebbi szakkönyvekben, így a valószínűsége az úgynevezett „fordított”.

Definíció szerint a feltételes valószínűség kapjuk:

ahol a valószínűsége az esemény használt képlet a teljes valószínűség:

Ha összeadjuk az összes. kap a készülék, így a szorzó. Ez nem függ. Meg lehet tekinteni, állandó, amely megtalálható a végén a normalizációs feltételt.

2. Közös értelmezés.

Vannak n egymást kizáró hipotézisek mi van benne egy tárgyat, és a valószínűségek, amellyel ezek a változások következnek be. Egy esemény bekövetkezik. amelyről ismert, hogy a valószínűség, amelyben előfordul az egyes lehetőségeket. Ez szükséges, hogy értékelje a valószínűsége, hogy a tárgy van elhelyezve egy bizonyos módon.

Jelöljük az állandó tényező

Bayes formula hasznos emlékezni a következő módon:

Egy fontos speciális eset a korábbi valószínűsége, hogy egy állandó, amely tartalmazza az állandó és kap:

Ennek matematikai azonosság Bayes formula nem kétséges. Feladatok, amelyekről ismert, hogy minden valószínűség könnyen megoldható.

1. PrimerN ismert a priori valószínűsége, hogy egy véletlenszerűen kiválasztott beteg egészséges. = 0,995, vagy szenvednek a tuberkulózis, = 0,005, ott egy olyan esemény volt - a röntgendiagnosztikában tuberkulózis, ismert feltételes valószínűség = 0,95 (érzékenység) = 0,01 (specificitás). Ebből a posteriori valószínűsége annak, hogy a beteg:


Tehát azt látjuk, hogy miután megvizsgálta annak a valószínűségét, hogy a beteg nőtt 0,005-0,32. Azonban az a posteriori valószínűsége, hogy a beteg egészséges, még nagyobb:

Mi az oka annak, hogy téves diagnózis két esetben háromból? Növelése a módszer érzékenysége 100% nem segít megoldani a problémát: a betegek száma túl kicsi, sőt elég magas (99%) sajátossága a módszer nem segít az ügyben. Világossá válik kiszámítása után az úgynevezett Bayes-faktor - az arány hátsó valószínűségek. A válasz a termék két tényező - a valószínűsége hányadost és a priori valószínűségek:

Minden bonyolult, mint az egyetlen hivatalos problémák valószínűségszámítás, térjünk vissza a problémák a statisztika, és megpróbálta alkalmazni a Bayes formula a probléma választotta a modell az objektum (azonosítás a paraméterei). Megkérdőjelezhető két pontot:

1. Lehet feltesszük a modell ismeretlen paraméterek valószínűségi változók?

2. Ha igen, honnan tudjuk, hogy a priori valószínűségek?

Mi megoldjuk két módon - szabványos építési N paraméter CI (konfidencia intervallum) és Bayes-építési megbízhatósági intervallumot N (hiteles intervallum).

A hipotézisek számát egyenlő 6, és az megfelel a lehetséges legnagyobb számú fehér golyó N:

Esemény. ahol - óraszámban a fekete golyót.

Fontos megjegyezni, hogy a számítás „valószínűségek” - nem függ attól, hogy figyelembe vesszük az ismeretlen paraméter véletlen változó N (tapadt a Bayes-módszer) vagy ismeretlen állandó:

Megoldás hagyományos módon.

Ha a szám a fehér golyó, mint 2, akkor a valószínűsége megfigyelése esetén - a megjelenése a kiválasztási a visszatérő 4 fekete golyó, kevesebb lenne, mint

Következtetés - ismeretlen paramétert (a száma fehér golyó N) tartozik, az [0..2] valószínűséggel 0,95: P (0≤N≤2) ≥0.95 = 1- α. Az határait „megbízhatósági intervallum” (konfidencia intervallum) határozza meg a kísérlet eredményeit (esemény). Jellemzően úgy van megválasztva, hogy egy nagy kísérletsorozatot szóló térköz N számú (1-α) 100% -ában. Vannak véletlenszerű időközönként határokat, de a beállítás - nem véletlen.

Magyarázat. Hogyan építsünk megbízhatósági intervallum általában? A gépen (N. X), ahol N - a modell ismeretlen paraméter (a szám a fehér golyó a doboz), és X nagyságát mérik egy véletlen kísérlet (több fekete golyó meg), meg kell építeni egy olyan területen, ahol a pont (N. X) nagy valószínűséggel (például P> 0,95). Ezt előnyösen rögzítésével különböző értékeket N = N, és meghatározza a határait x, hogy az alábbi feltétel :. Az így kapott „vertikális” (párhuzamos az Y-tengely) szétszóródás időközönként nevezett nyílások (SCA t lőknek időközönként). Ezek határai nem véletlenszerű, és függ n és α. Most minden rögzített X megtaláljuk a „horizontális” tartomány, amely áthalad az épített környezetben. Határait lesz véletlen, ha a véletlen ordináta X. Ez a megbízhatósági intervallum. Helyes beszélni nem „paraméter értékét tartományba esik N” és „intervallum lefedi egy pont felel meg a paraméter értéke N”. Amerikai statisztikák beszélnek a patkó (kép intervallum), amely megtámadja a rögzített szeg (opció). Ahhoz, hogy az ötlet a megbízhatósági intervallum azt több mint 100 éve.

Bayes-döntés módszer.

Feltételezzük, hogy a több fehér golyó és a véletlenszerű N érték a kísérlet előtt egy egyenletes eloszlású. Sőt, itt van egy teljes felháborodást - formája az eloszlás lehet más.

Tehát, ennek eredményeként a tapasztalat egységes priori eloszlás vált rohamosan csökkenő sorrendben. . Határozza meg az intervallum (hiteles intervallum), amely a valószínűsége> 0,95 kap egy esélyt (keretében a Bayes-féle megközelítés) értéke N. ugyanaz lesz: 0≤N ≤2. Azonban egy másik lehetőség a priori valószínűségek lényegében megváltoztatja a választ. Tehát nagyon biztos a priori ismereteket tud ellenállni bármilyen kedvezőtlen tényeket. Például, ha voltunk tapasztalni szinte biztos, hogy az urna négy fehér golyó, a hátsó valószínűségek, és mozgassa az irányba számának csökkentése N, de még mindig

A választás a priori eloszlás teszi a siker vagy kudarc az alkalmazás Bayes véletlen. Ez nem meglepő, hogy a Bayes maga nem mertek műveiket.

Háttér.

A tudás a történelem nélkülözhetetlen szerepének megértése a Bayes-formula. Thomas Bayes (Bayes) vizsgálták az alapvető probléma a statisztika - értékelte a p valószínűséggel az esemény gyakoriságának előfordulásuk ν. Ha egy nagy dobozt, amelyben van golyók ( „lakosság”), akkor véletlenszerűen kivont n golyók ( „fetch”), és ezek közül K golyó fehér volt, mit tudsz mondani egy ismeretlen hányada fehér golyó p a teljes népesség körében ? Legyen n = 100 és K = 24. Nem lenne bölcs dolog, hogy egyszerűen egyenlővé a véletlen változó ν = K / n ismeretlen számunkra a p értékét, és feltételezzük, hogy p = 0,24 (?). Az extrakció után a következő 100 golyó ν értéke más lesz. Bayes javasolt figyelembe venni a p értékét véletlenszerű, és az összes a priori hipotézist equiprobable érték p (p egyenletes eloszlású 0 és 1 között). Ezért az a posteriori valószínűsége, hogy a p értékét zárt a p 1 p 2 megkapta a képlet:

Más szavakkal, a valószínűség-sűrűség értéke p:

ahol a C állandó meghatározzuk a normalizáció állapotban. Ha a minta mérete n növekszik (ν ≠ 0, ν ≠ 1, n → ∞), majd az elosztó p megközelíti a normális eloszlás, az átlagos értéke m = ν és szórása σ = (ν (1- ν)) 1/2 / n 1/2. Ez azt jelenti, hogy p valószínűséggel értéke abban rejlik, az intervallumon belül 0,95 (m-2σ, m + 2σ), azaz .: ν - 2 (ν (1- ν)) 1/2 / n 1/2

1 / n. A gyakorlatban ez ugyanaz a válasz, amely megadja a modern jelentése elmélet, de itt a p értéke már nem véletlenszerűnek minősítjük, és az intervallum (ν -. 2 (ν (1- ν)) 1/2 / n 1/2 ν +2 (ν (1 - ν)) 1/2 / n 1/2) nevezzük megbízhatósági (konfidencia intervallum). Tehát, az első gyakorlati alkalmazása Bayes formula a statisztikai probléma kiderült, hogy sikeres legyen! Laplace, Bayes formula népszerűsítette, és adott neki egy modern megjelenés. Azonban általában a csere az ismeretlen a priori eloszlás egyenletes nem indokolt - a bizonytalanság nem jelenti azt, egyenlő valószínűséggel! Ezért a gyakorlatban alkalmazzák a Bayes-megközelítés hitelét vesztette, és a munka a Student-féle, Fisher és Neumann első harmadában a XX század megalapozta a modern iskola frekvencia.

O ain hatálya képletű Bayes

1) A matematikai eszköz valószínűségszámítás.

2) A statisztika - mint a korábbi tapasztalatok általánosítása. Feltételezzük, hogy tapasztalatot szereztünk, amely lehetővé teszi, hogy a kísérleti (!), Hogy értékelje a priori valószínűség-eloszlás. Továbbá, úgy véljük, hogy előttünk egy új objektum tartozik ugyanahhoz a csoporthoz. Ez lehetővé teszi, hogy építsen osztályozók alapján Bayes-formula.

3) A statisztika - összehasonlítani a különböző modellek, ha priusza annyira homályos, hogy általában elhanyagolható. Nagyon gyakran használt BIC (Bayes információs kritérium).

4) leírása lelkiállapot. Támogatói értelmezési valószínűsége egy esemény, mint egy intézkedés szubjektív bizalmat képességeit is újraszámolja ezeket az értékeket a folyamat az új adatokat. Nyilvánvaló, hogy a matematikai itt hasonló lehet a darálóval por: az önkényesség meghatározására a priori valószínűségek veszélyes lehet.

Kapcsolódó cikkek