apriori algoritmus, az adatok a tudomány

Megyünk tovább cikksorozatot Top 10 adatbányászati ​​algoritmusok és úgy hasznos és érdekes algoritmus Apriori (Apriori).

Apriori algoritmus megkeresi egyesület szabályai és azokra az adatbázisokra, amelyek nagyszámú tranzakciók.

Mi az összefüggés szabályok? Tanulmány a szövetségi szabályok - a használt technika adatbányászati ​​felfedezéséhez kapcsolatok és viszonyok között a változók adatbázisban.

Mi egy példa segítségével Apriori algoritmus? Tegyük fel, hogy van egy adatbázis egy szupermarket tranzakciós adatok. El lehet képzelni, az adatbázis, mint egy hatalmas asztal, amelynek minden sora - a tranzakció számát, és minden oszlop egy külön megvásárlása.

Alkalmazása Apriori algoritmus alapján azonosítani tudjuk a megvásárolt árut együtt - azaz, állítsa be a Szövetség szabályai.

Ez ad nekünk:

Tudja azonosítani a tárgyakat, melyekre gyakran vásárolt együtt. A fő feladat a marketing -, hogy a vásárlók több. Kapcsolódó termékek nevezzük készletek.

Talán észrevetted, hogy a chips, chips szósszal és szóda gyakran állnak a polcokon ott. Ezt nevezik a két részből álló készlet. Amennyiben az adatbázis elég nagy, akkor sokkal nehezebb „látni” a kapcsolat, különösen akkor, ha foglalkozunk trohelementnymi vagy nagyobb készletek. Csak erre, és létrehozta Apriori algoritmus.

Hogyan működik az algoritmus Apriori? Mielőtt elmész a lényege az algoritmus, akkor meg kell adnunk 3 paraméter:

  1. Először is, meg kell állítani a méretét a készlet. Azt akarod, hogy meghatározzák a két elem, trohelementny beállítani, vagy valami más?
  2. Másodszor, azonosítani a támogatás - a tranzakciók száma, benne a készlet osztva az összes tranzakciók száma. Set támogatott ez a leggyakoribb gépelés.
  3. Harmadszor, hogy meghatározza hitelességét. azaz a feltételes valószínűsége, hogy egy bizonyos termék a kosárban más tételekkel. Példa: Chips a kit egy 67% esélye, hogy egy kosárba szódával.

Egyszerű Apriori algoritmus három lépésből áll:

Vajon ez a módszer a tanulás és öntanuló ez? Apriori általában úgy tekintik, mint egy öntanuló algoritmust, ezért gyakran használják, hogy érdekes mintákat és kapcsolatokat.

Van egy változata Apriori algoritmus képes osztályozni jelzett adatok

Miért Apriori? Ez egyszerű, érthető, legkorealizuem, és számos módosítást.

Másrészt ...

A működés során az algoritmus lehet nagyon erőforrás-igényes; számítások hosszú időt vesz igénybe.

Ahol használják? Sok megvalósításai Apriori. Néhány a legnépszerűbb - ez ARtool. Weka és az Orange.

A pszeudo-kód algoritmus Apriori

apriori algoritmus, az adatok a tudomány

Végrehajtása Apriori algoritmus R

apriori (adatok, paraméter = NULL, megjelenés = NULL, kontroll = NULL)

  • adat
    osztályba tartozó objektum ügyletek vagy bármilyen adat szerkezetet, amely lehet kényszerítik tranzakciók (például egy bináris mátrix vagy data.frame).
  • paraméter
    osztályba tartozó objektum APparameter vagy megnevezett listán. Az alapértelmezett viselkedés az enyém szabályzat támogatásával 0,1, a bizalom 0,8, maxlen 10.
  • megjelenés
    osztályba tartozó objektum APappearance vagy megnevezett listán. Ezzel az érvvel elem megjelenése lehet korlátozni (munkagépek zárja sablonok). Alapértelmezésben minden elem jelenjen korlátlan.
  • ellenőrzés
    osztályba tartozó objektum APcontrol vagy megnevezett listán. Szabályozza a algoritmikus teljesítménye a bányászati ​​algoritmus (tétel válogatás stb)