Függvénylista statisztikák eszköztár

Alkotó hierarchikus fa bináris klaszterek

Z = kötés (Y)
Z = kötés (Y, 'módszer')

Z = rudazat (Y) funkció lehetővé teszi, hogy egy hierarchikus fa bináris csoportosítási algoritmus használatával. A bemeneti argumentum Y vektor közötti távolságok pár a több adatforrás tárgyak a többdimenziós térben. A száma vektor elemek egyenlő Y, ahol - az objektumok száma az eredeti adathalmaz. Y lehet beszerezni, mint kimeneti paraméter pdist funkciót. Általában, a bemeneti argumentum Y lehet meghatározni, mint egy mátrix közötti távolságok pár kezdeti számos adatobjektum szerint a formátum a kimeneti paraméter pdist funkciót.

Output paraméter Z egy mátrix, amely információkat tartalmaz a klaszter fa. Z a dimenzió. Véges klaszter-fa csomópontok a tárgyak az eredeti adathalmaz - megfigyelések többváltozós véletlen változó Y, 1-től m. Végponti csomópontot hogy elszigetelt klaszterek. Ezek fürtözött fedő facsomópontok. Minden további fedő csomópontja klaszter megfelel i-edik sorának a mátrix Z. Ő társított m index + i.

Oszlopok 1 és 2 a mátrix Z tartalmaz indexek objektumok kapcsolódik az új klaszter. A klaszterek száma képződött egyenlő bináris (m-1).

3. oszlopában a mátrix Z tartalmaz egy értéket közötti távolságok pár tárgyak kombinált klaszterekbe.

Tegyük fel, hogy a klaszterben 30 fa mag gyűjtemény. Amennyiben a 10. klasztert kombinálásával kialakított 5-én és 7-én tárgyak, és a távolság közöttük 1,5, akkor a 10. sorban a mátrix Z tartalmazza a következő értékeket Z (:, 10) = [6 május 1.5]. Ez a klaszter lesz indexe 10 + 30 = 40. Ha a 40 kódot észlelt a következő sorokban Z, ez azt jelenti, hogy a 40 bináris klaszter összevonásra kerül egy új felette klaszter.

Z = kötés (Y, „módszer”) bemeneti argumentum „módszer” lehetővé teszi, hogy adjon meg egy csoportosítási algoritmus. Egy bemeneti argumentum érték „módszer” úgy definiáljuk, mint egy teszt vonalat. A következő csoportosítási algoritmusok

ahol - r és s súlypontjai a fürtöket.

Ennek eredményeként a súlypontja algoritmus nem érhető el monoton klaszter fa. Ez akkor fordulhat elő, ha a távolság a unió két klaszter, a harmadik klaszter kisebb, mint a távolság a R vagy S k. Ebben az esetben a dendrogram megváltoztathatja az irányt, ami az oka egy másik csoportosítási algoritmus.

ahol - a távolság a klaszterek r és s, úgy határozzuk meg, egy centroid algoritmus. Inkrementális algoritmus alapján a növekedés teljes négyzetösszeg Csoporton belüli csatlakozása csoportok r és s. Csoporton belüli négyzetek összege a négyzetének összege közötti távolságok minden tárgyat a klaszter és a klaszter súlypontja.

Példák a használata a funkció kialakítására hierarchikus fa bináris klaszterek

1. képződése bináris fa hierarchikus klaszter egy 10-dimenziós normális eloszlású. Az objektumok száma az egy sor bemeneti adatok 20. A grafikus ábrázolása a bináris klaszter fát alkalmazásával végezzük dendrogramot funkciót.

Függvénylista statisztikák eszköztár

2. képződése bináris fa hierarchikus klaszter kétdimenziós véletlen változó. Az objektumok száma a beállított forrás adatok egyenlő 7. Különböző csoportosítási algoritmusok hasonlítjuk össze. Grafikus ábrázolása a csoportosításának eredményeit által végzett dendrogramot funkciót.

2.1. háttér:

2.2. Klaszterek egy algoritmus

Függvénylista statisztikák eszköztár

2.3. Klaszterek egy algoritmus

Függvénylista statisztikák eszköztár

2.4. Klaszterek egy algoritmus

Függvénylista statisztikák eszköztár

2.5. Csoportosítási algoritmus segítségével súlypontja algoritmus

Függvénylista statisztikák eszköztár

2.6. Csoportosítási algoritmus segítségével inkrementális algoritmus

Függvénylista statisztikák eszköztár

Kapcsolódó cikkek