Bayes' általános képletű - a
„A fizikai jelentése” és terminológia
Bayes formula lehetővé teszi, hogy »rendezni az ok-okozati«: a jól ismert tény, hogy az esemény kiszámításához a valószínűsége, hogy ez volt köszönhető, hogy emiatt.
Események tükrözve az intézkedés az „okok” ebben az esetben általában úgynevezett hipotéziseket. mivel azok - az állítólagos események okozta ezt. A feltétel nélküli valószínűsége érvényességének hipotézis hívják a priori (ami valószínű oka egyáltalán), és feltételes - azon a tényen alapul egy múltbeli esemény - a posteriori (hogy mennyire valószínű az ok alapult esemény adatok).
Egyik fontos következménye a Bayes formula a képlet teljes valószínűségű esemény, attól függően, hogy több egymást kizáró hipotézis (és csak őket!).
- az esemény valószínűsége B. függ számos hipotézist Ai. ha ismerjük a fokú megbízhatóságát ezeket a hipotéziseket (például kísérletileg mért);
Ha egy esemény akár Ai miatt. hogy ha ez megtörténne, akkor, biztos volt valami oka annak, hogy az
Bayes formula
Az átadás a P (B) a jogot arra, hogy a kívánt expressziós.
spam szűrési módszer,
Alapuló módszer Bayes-tétel, talált sikeres alkalmazása az anti-spam szűrés.
Amikor a képzés a szűrő minden felmerült a betűket a szó kiszámítjuk és tároljuk a „tömeg” - annak a valószínűsége, hogy a levél ezt a szót - spam (a legegyszerűbb esetben - a klasszikus definíciója a valószínűsége „megjelenését a spam / megjelenések csak a” [1]).
Amikor ellenőrzi az újonnan betűk kiszámított valószínűsége, hogy - a spam, a fenti képlet a több hipotézist. Ebben az esetben a „hipotézis” - ez az a szó, minden egyes szó, „a pontosság a hipotézis” -% -a ezt a szót írni, és a „függés események a hipotézist» P (B | Ai) - vychislennny előtt »tömeg« a szó. Ez a „tömeg” a levél, ebben az esetben - nem az, hogy más, mint az átlagos „tömeg” minden szavát.
A betűk hozzárendelése „spam”, vagy „nem spam” azon a tényen alapul, mint a felhasználó által megadott, ha a „súlyát” egy bizonyos bar (általában véve 60-80%). Miután eldöntötte, a levél az adatbázisban frissített a „súlyát” szavak szerepelnek benne.
vonás
Ez a módszer egyszerű (elemi algoritmusok), kényelmes (nincs szükség a „fekete listák” és hasonló megoldásokat), hatékony (edzés után egy kellően nagy mintán vágások 95-97% -a spam, és ha bármilyen hiba lehet doobuchat). Általában vannak arra utaló jelek annak széles körű használata, mint ahogy az a gyakorlatban - ez alapján épülnek szinte minden modern spam szűrők.
Azonban a módszer és az alapvető hibája: ez azon a feltételezésen alapul. hogy bizonyos szavak gyakoribbak spam, míg mások - normál betűkkel. és hatékony, ha ez a feltételezés téves. Mivel azonban a gyakorlat azt mutatja, ez a fajta spam még egy személy nem tudja meghatározni a „szem” - csak miután elolvasta a levelet, és megértette a jelentését.
jegyzetek
- ↑ Bonyolultabb esetekben, esetleges előkezelés a szöveg: így szó az eredeti formában, az eltávolítása funkció szóval, a számítás a „tömeg” az egész mondatok, átírási, stb ..
Lássuk mi Formula Bayes „más szótárak:
Bayes formula - Bayes-tétel egyik alapvető tételek az elemi valószínűségszámítás, amely meghatározza a valószínűségét egy esemény egy olyan környezetben, ahol alapján megfigyelés ismert, csak néhány részleges információt az eseményeket. Szerint a Bayes formula lehet ... ... Wikipedia
Bayes-tétel - (vagy Bayes formula) az egyik legfontosabb tétele a valószínűségszámítás, amely lehetővé teszi, hogy meghatározza a valószínűsége, hogy egy bizonyos esemény történt (a hipotézis), ha csak közvetett bizonyítéka az a tény (adat), ami lehet pontatlan ... Wikipedia
A genetikai tanácsadás - vagy genetikai tanácsadást, orvosi ellátás kedves azoknak, akik attól tartanak, hogy a betegség vagy születési rendellenesség kifejezetten vagy feltételezett örökletes jellegű megtörténhet bármely családtag. A feladat a genetikai ... ... Collier enciklopédiája
Információ entrópia - információ entrópia mértéke bizonytalan, illetve kiszámíthatatlansága az információ, a bizonytalanság a bekövetkezte az elsődleges szimbóluma ábécé. Az információ hiányában a veszteség számszerűen egyenlő a mennyiségű információt a karakter ... ... Wikipedia
Feltételes entrópia - entrópia (információ) véletlenszerűség mértéke információ, a bizonytalanság a bekövetkezte az elsődleges szimbóluma ábécé. Az információ hiányában a veszteség számszerűen egyenlő a mennyiségű információt a karakter a továbbított üzenet. Például, a ... ... Wikipedia
Az entrópia (információ-elmélet) - entrópia (információ) véletlenszerűség mértéke információ, a bizonytalanság a bekövetkezte az elsődleges szimbóluma ábécé. Az információ hiányában a veszteség számszerűen egyenlő a mennyiségű információt a karakter a továbbított üzenet. Például, a ... ... Wikipedia
- Valószínűségszámítás és matematikai statisztika, a példák és problémák. Nikitina NS Ez tankönyv tartalmazza a feladatok és példák a következőkre vonatkozó szakaszai az elmélet a valószínűség és a matematikai statisztika: algebra az események, a fogalom klasszikus valószínűség ... Tovább Vásárlás 544 rubelt
- Valószínűségszámítás és matematikai statisztika, a példák és problémák. Tankönyv. N. S. Nikitina, AV Stepanov. Ez tankönyv tartalmazza a feladatok és példák a következőkre vonatkozó szakaszai az elmélet a valószínűség és a matematikai statisztika: algebra az események, a fogalom klasszikus valószínűség ... Tovább Vásárlás 494 UAH (Ukrajna esetében)
- Könyve problémák az elmélet a valószínűség. fakó IA A könyv tartalmazza a 700 feladatok, amelyek a következő tanfolyami témák: kombinatorika; események és műveletek rájuk; klasszikus valószínűségi mezőn; geometriai valószínűség; ... Tovább Vásárlás 190 rubelt