Leíró statisztika a numerikus változók számára

6.2. A statisztikai jellemzők megkötése

A numerikus változók leíró statisztikájának lekéréséhez kattintson a Statisztika gombra a Frekvenciák párbeszédpanelen. (Statisztika). Megjelenik a Frekvenciák: Statisztika párbeszédpanel.

Ábra. 6.2: A frekvenciák párbeszédpanel: Statisztika

Az Átlagos értékek csoportban az alábbi lehetőségek közül választhat:

Quartiles (Quartiles). Megjelenik az első, a második és a harmadik kvartilis. Az első kvartilis (Q1) a mért értékek skálapontja, a mért értékek 25% -a alatt (balra) található. A második kvartilis (Q2) az a pont, amely alatt a mért értékek 50% -a található. A második kvartilis a mediánnak is nevezik. A harmadik kvartilis (Q3) a mért értékek skálapontja, amely alatt az értékek 75% -a található. Ha az adatok csak megbízási összefüggés formájában vannak, akkor az intervallum szélességet használjuk a terjedés mértékének. Ez a definíció
  • Vágj pontokat. Meg kell számolni azokat a százalékos értékeket, amelyek a mintát ugyanazon szélességű megfigyelőcsoportokká választják, azaz azonos számú mért értéket tartalmaznak. Az alapértelmezett csoportok száma meghatározott 10. Ha, például 4, mutatjuk kvartilisek azaz quartilist a százalékoknak megfelelő 25, 50 és 75. Látható, hogy a számos megjelenített centilis az eggyel kisebb, mint egy előre meghatározott csoportok száma.
  • Százalék (ok). Itt a felhasználó által meghatározott százalékos értékeket értjük. Adjon meg egy százalékos értéket 0 és 100 között, és kattintson a Hozzáadás gombra. Ismételje meg ezeket a lépéseket az összes kívánt percentilis értékre. A növekvő sorrendben lévő értékek a listában jelennek meg. Például, ha megadja a 25, 50 és 75 értéket, akkor kvartiliseket kapunk. Megadhatja a percentilis értékét, például a 37 és a 83. Az első esetben (37) a kiválasztott változó értéke alatta látható, amely alatt az értékek 37% -a fekszik, és a második esetben (83) - az érték, amely alatt az értékek 83% -a található.

A Diszperziós csoportban kiválaszthatja a következő szórási intézkedéseket:

Std. az eltérés (szórás) a mért értékek terjedésének mértéke; ez egyenlő a variancia négyzetgyökével. A normál eltérés kétszerese, amely az átlag mindkét oldalán van elhelyezve, a normál eloszlásnak megfelelő minta összes értékének megközelítőleg 67% -a található.
  • A variancia a szórásnégyzet, ezért ez a jellemző a mért mennyiségek elterjedésének mértéke is. O on az összes mért érték eltérésének négyzetét jelenti az aritmetikai átlagtól, osztva a mérések számával mínusz 1 értékkel.
  • A tartomány a legmagasabb érték (maximum) és a legkisebb (legkisebb) érték közötti különbség.
  • Minimum - A legkisebb érték.
  • Maximális - A legmagasabb érték.
  • S.E. átlag - A standard hiba kétszeresével megegyező szélességben, a középérték körül van rajzolva, az átlagos lakossági érték megközelítőleg 67% valószínűséggel helyezkedik el. A standard hiba a standard szórás, amelyet a minta méretének négyzetgyöke oszt.

  • Jellemzően a standard eltérés és a standard hiba az intervallum skálához kapcsolódó változók varianciájának és a normál eloszlásnak tulajdonítható. Mint fentebb említettük, a standard deviáció lehetővé teszi az egyes értékek variációs tartományának meghatározását. Szerint az úgynevezett szabály csülök, az egyik tartományban a szórás (lefedő szélessége szórás mindkét irányban a középérték) körülbelül 67% értékek a tartományban a mérvadó eltérés kétszerese - körülbelül 95%, és a tartományban háromszorosa a standard deviáció - mintegy 99% -a az értékeket .

    Másrészről, a standard hiba lehetővé teszi, hogy beállíthasson egy megbízhatósági intervallumot az átlaghoz. A standard hiba kétszeresének tartományában a középérték mindkét oldalán, mintegy 95% -os valószínűséggel a lakosság átlaga. Kb. 99% -os valószínűséggel a standard hiba háromszorosa. Gyakran csak az egyik ilyen terjedési arányt jelöli, általában egy standard hiba, mivel értéke kisebb. Minden esetben feltétlenül meg kell tudni, hogy a diszperzió milyen mértékű.

    A Központi tendencia csoportban a következő jellemzőket választhatja ki:

    Az átlag a mért értékek számtani középértéke; azt jelenti, hogy az értékek összege osztva a számukkal. Például, ha 12 mért érték van és összegük 600, akkor az átlagos érték x = 600. 12 = 50.
  • A medián a mért értékek skáláján a legmagasabb pont, amely felett és alatt mért értékek felében van. Például, ha a mért értékek:

  • akkor először növekvő sorrendben vannak elhelyezve: 233445 67889.

    Ebben az esetben a medián értéke 5. Összesen 11 mért érték van, ezért a medián a hatodik érték. Ezen felül 5 érték van, és alatta is - 5. A páratlan értékszám mellett a medián mindig egybeesik a mért értékek egyikével. Páros szám esetén a medián a két szomszédos érték számtani középértéke lesz. Például, ha a következő mért értékek állnak rendelkezésre:

    akkor a medián ebben az esetben egyenlő lesz: (6 + 7). 2 = 6,5.

    A mód a leggyakoribb érték a mintában. Ha ugyanaz a legmagasabb frekvencia több értéknél fordul elő, akkor a legkisebb közülük választják ki.
  • Összeg (összeg) az összes érték összege.

  • Az Elosztás csoportban választhatja ki az alábbi disztribúciós aszimmetriát:

    A ferdeség a frekvenciaeloszlás eltérésének mértéke a szimmetrikus eloszlásból, vagyis az, amely ugyanolyan számú értéket tartalmaz ugyanarra a távolságban az adatminta mindkét oldalán az átlagértéktől. Ha a megfigyelések normális eloszlásnak felelnek meg, akkor az aszimmetria nulla. A normál eloszlás ellenőrzéséhez a következő szabályt kell alkalmazni: Ha az aszimmetria lényegesen különbözik a nullától, akkor el kell utasítani azt a hipotézist, hogy az adatokat egy normálisan elosztott populációból vesszük. Ha az aszimmetrikus eloszlás csúcsát kisebb értékekre toljuk át, akkor pozitív aszimmetria van, ellenkező esetben negatív aszimmetria.
  • Kurtosis (variációs koefficiens vagy kurtózis) - jelzi, hogy az eloszlás lapos (nagy együttható) vagy meredek. A variációs koefficiens nulla, ha a megfigyelések normális eloszlásnak felelnek meg. Ezért egy normál eloszlás ellenõrzésére további szabály alkalmazható: Ha a variációs együttható szignifikánsan különbözik a nullától, el kell utasítani azt a hipotézist, miszerint az adatokat egy normálisan elosztott populációból veszik.

  • Általános szabályként az intervallum skálahoz tartozó és a normál eloszlásnak megfelelő változók esetében a fő jellemzőként az átlagértéket használják. és a diszperzió mértéke - a standard eltérés vagy a standard hiba. Rendes vagy intervallum változók esetében, amelyek nem felelnek meg a normál eloszlásnak, vagyis a középső vagy az első és a harmadik kvartilisnek. A nominális skálahoz kapcsolódó változók esetében a divaton kívül egyéb fontos jellemzők is lehetnek.

    A párbeszédablakban van még egy jelölőnégyzet:

    Az értékek a csoport középpontjai (az értékek a csoportok átlagpontjai). Ha ezt a négyzetet ellenőrzi, majd a medián és a fennmaradó percentilis kiszámításánál a jellemzők becslését a koncentrált adatok alapján határozzák meg. Külön kérdése van ennek a kérdésnek.

    A változó változó (kor) esetében meghatározzuk a következő jellemzőket: középérték, medianus, mód, kvartilisek, szórás, variancia, span, minimum, maximum, standard hiba, aszimmetria és kurtózis. Tegye a következőket:

    Válassza a Elemzés / leíró statisztika / gyakoriságok menüpontot. (Frekvenciák)
  • A Frekvenciák párbeszédpanelen kattintson a Visszaállítás gombra az előző beállítások törléséhez.
  • Húzza az alter változót a kimeneti változók listájára.
  • Kattintson a Statisztika gombra. (Statisztika).
  • A Frekvenciák: Statisztika párbeszédpanelen jelölje be a kívánt jellemzők jelölőnégyzetét. Ezután kattintson a Folytatás gombra. Visszatér a frekvenciákhoz.
  • A Frekvenciák párbeszédablakban kapcsolja ki a Display frekvenciatáblák opciót. Kattintson az OK gombra.