Bayes' általános képletű - a

„A fizikai jelentése” és terminológia

Bayes formula lehetővé teszi, hogy »rendezni az ok-okozati«: a jól ismert tény, hogy az esemény kiszámításához a valószínűsége, hogy ez volt köszönhető, hogy emiatt.

Események tükrözve az intézkedés az „okok” ebben az esetben általában úgynevezett hipotéziseket. mivel azok - az állítólagos események okozta ezt. A feltétel nélküli valószínűsége érvényességének hipotézis hívják a priori (ami valószínű oka egyáltalán), és feltételes - azon a tényen alapul egy múltbeli esemény - a posteriori (hogy mennyire valószínű az ok alapult esemény adatok).

Egyik fontos következménye a Bayes formula a képlet teljes valószínűségű esemény, attól függően, hogy több egymást kizáró hipotézis (és csak őket!).

- az esemény valószínűsége B. függ számos hipotézist Ai. ha ismerjük a fokú megbízhatóságát ezeket a hipotéziseket (például kísérletileg mért);

Ha egy esemény akár Ai miatt. hogy ha ez megtörténne, akkor, biztos volt valami oka annak, hogy az


Bayes formula


Az átadás a P (B) a jogot arra, hogy a kívánt expressziós.

spam szűrési módszer,

Alapuló módszer Bayes-tétel, talált sikeres alkalmazása az anti-spam szűrés.

Amikor a képzés a szűrő minden felmerült a betűket a szó kiszámítjuk és tároljuk a „tömeg” - annak a valószínűsége, hogy a levél ezt a szót - spam (a legegyszerűbb esetben - a klasszikus definíciója a valószínűsége „megjelenését a spam / megjelenések csak a” [1]).

Amikor ellenőrzi az újonnan betűk kiszámított valószínűsége, hogy - a spam, a fenti képlet a több hipotézist. Ebben az esetben a „hipotézis” - ez az a szó, minden egyes szó, „a pontosság a hipotézis” -% -a ezt a szót írni, és a „függés események a hipotézist» P (B | Ai) - vychislennny előtt »tömeg« a szó. Ez a „tömeg” a levél, ebben az esetben - nem az, hogy más, mint az átlagos „tömeg” minden szavát.

A betűk hozzárendelése „spam”, vagy „nem spam” azon a tényen alapul, mint a felhasználó által megadott, ha a „súlyát” egy bizonyos bar (általában véve 60-80%). Miután eldöntötte, a levél az adatbázisban frissített a „súlyát” szavak szerepelnek benne.

vonás

Ez a módszer egyszerű (elemi algoritmusok), kényelmes (nincs szükség a „fekete listák” és hasonló megoldásokat), hatékony (edzés után egy kellően nagy mintán vágások 95-97% -a spam, és ha bármilyen hiba lehet doobuchat). Általában vannak arra utaló jelek annak széles körű használata, mint ahogy az a gyakorlatban - ez alapján épülnek szinte minden modern spam szűrők.

Azonban a módszer és az alapvető hibája: ez azon a feltételezésen alapul. hogy bizonyos szavak gyakoribbak spam, míg mások - normál betűkkel. és hatékony, ha ez a feltételezés téves. Mivel azonban a gyakorlat azt mutatja, ez a fajta spam még egy személy nem tudja meghatározni a „szem” - csak miután elolvasta a levelet, és megértette a jelentését.

jegyzetek

  1. ↑ Bonyolultabb esetekben, esetleges előkezelés a szöveg: így szó az eredeti formában, az eltávolítása funkció szóval, a számítás a „tömeg” az egész mondatok, átírási, stb ..

Lássuk mi Formula Bayes „más szótárak:

Bayes formula - Bayes-tétel egyik alapvető tételek az elemi valószínűségszámítás, amely meghatározza a valószínűségét egy esemény egy olyan környezetben, ahol alapján megfigyelés ismert, csak néhány részleges információt az eseményeket. Szerint a Bayes formula lehet ... ... Wikipedia

Bayes-tétel - (vagy Bayes formula) az egyik legfontosabb tétele a valószínűségszámítás, amely lehetővé teszi, hogy meghatározza a valószínűsége, hogy egy bizonyos esemény történt (a hipotézis), ha csak közvetett bizonyítéka az a tény (adat), ami lehet pontatlan ... Wikipedia

A genetikai tanácsadás - vagy genetikai tanácsadást, orvosi ellátás kedves azoknak, akik attól tartanak, hogy a betegség vagy születési rendellenesség kifejezetten vagy feltételezett örökletes jellegű megtörténhet bármely családtag. A feladat a genetikai ... ... Collier enciklopédiája

Információ entrópia - információ entrópia mértéke bizonytalan, illetve kiszámíthatatlansága az információ, a bizonytalanság a bekövetkezte az elsődleges szimbóluma ábécé. Az információ hiányában a veszteség számszerűen egyenlő a mennyiségű információt a karakter ... ... Wikipedia

Feltételes entrópia - entrópia (információ) véletlenszerűség mértéke információ, a bizonytalanság a bekövetkezte az elsődleges szimbóluma ábécé. Az információ hiányában a veszteség számszerűen egyenlő a mennyiségű információt a karakter a továbbított üzenet. Például, a ... ... Wikipedia

Az entrópia (információ-elmélet) - entrópia (információ) véletlenszerűség mértéke információ, a bizonytalanság a bekövetkezte az elsődleges szimbóluma ábécé. Az információ hiányában a veszteség számszerűen egyenlő a mennyiségű információt a karakter a továbbított üzenet. Például, a ... ... Wikipedia

  • Valószínűségszámítás és matematikai statisztika, a példák és problémák. Nikitina NS Ez tankönyv tartalmazza a feladatok és példák a következőkre vonatkozó szakaszai az elmélet a valószínűség és a matematikai statisztika: algebra az események, a fogalom klasszikus valószínűség ... Tovább Vásárlás 544 rubelt
  • Valószínűségszámítás és matematikai statisztika, a példák és problémák. Tankönyv. N. S. Nikitina, AV Stepanov. Ez tankönyv tartalmazza a feladatok és példák a következőkre vonatkozó szakaszai az elmélet a valószínűség és a matematikai statisztika: algebra az események, a fogalom klasszikus valószínűség ... Tovább Vásárlás 494 UAH (Ukrajna esetében)
  • Könyve problémák az elmélet a valószínűség. fakó IA A könyv tartalmazza a 700 feladatok, amelyek a következő tanfolyami témák: kombinatorika; események és műveletek rájuk; klasszikus valószínűségi mezőn; geometriai valószínűség; ... Tovább Vásárlás 190 rubelt
Egyéb "Formula Bayes könyv kérésre >>

Kapcsolódó cikkek