Diszperziós indexek a statisztikákban

Olvasási Idő ~6 Min.
A diszperziós indexek azért fontosak, mert leírják az adott sokaságban vagy mintában található változékonyságot. A következőképpen használhatja őket.

Az adateloszlásban a diszperziós indexek nagyon fontos szerepet játszanak. Ezek a mérések kiegészítik az ún. központi pozíció méréseit az adatok változékonyságának jellemzésével.

A diszperziós indexek kiegészítik a központi irányzatúakat. Az adatelosztásban is nélkülözhetetlenek. Ez azért van, mert ezek jellemzik annak változékonyságát. Relevanciájukat a statisztikai képzésben Wild és Pfannkuch (1999) emelte ki.

Az adatok változékonyságának észlelése a statisztikai gondolkodás egyik alapeleme, hiszen az adatok átlaghoz viszonyított szóródásáról ad információt.

Az átlag értelmezése

A számtani átlag a gyakorlatban széles körben alkalmazzák, de gyakran félreértelmezhető. Ez akkor fordul elő, ha a változó értékek nagyon ritkák. Ilyenkor az átlagos szórási indexeket (2) kell kísérni.

A diszperziós indexeknek három fontos összetevője van, amelyek a véletlen variabilitáshoz kapcsolódnak (2):

  • A körülöttünk lévő világban mindenütt jelen lévő felfogás.
  • Verseny a magyarázatáért.
  • A számszerűsítés képessége (ami a diszperzió fogalmának megértését és alkalmazásának ismeretét jelenti).

Mire használják a diszperziós indexeket?

Amikor egy sokaság mintájának adatait általánosítani kell A diszperziós indexek nagyon fontosak, mivel közvetlenül befolyásolják azt a hibát, amellyel dolgozunk . Minél több szórást gyűjtünk össze egy mintában, annál nagyobb méretre van szükségünk ahhoz, hogy ugyanazzal a hibával dolgozzunk.

Másrészt ezek az indexek segítenek meghatározni, hogy adataink messze vannak-e a központi értéktől. Megmondják, hogy ez a központi érték megfelelő-e a vizsgált populáció reprezentálására. Ez nagyon hasznos a disztribúciók összehasonlításához és felfogni kockázatokat a döntéshozatali folyamatban (1).

Ezek az arányok nagyon hasznosak az eloszlások összehasonlításához és a kockázatok megértéséhez a döntéshozatal során. Minél nagyobb a szóródás, annál kevésbé reprezentatív a központi érték .

A leggyakrabban használtak a következők:

  • Hatótávolság.
  • Statisztikai eltérés .
  • Variancia.
  • Standard vagy tipikus eltérés.
  • Variációs együttható.

A diszperziós indexek függvényei

Hatótávolság

A rang használata elsődleges összehasonlításra szolgál. Így csak a két szélsőséges megfigyelést veszi figyelembe . Ezért csak kis mintákhoz ajánlott (1). Ez a változó utolsó értéke és az első (3) közötti különbség.

Statisztikai eltérés

Az átlagos eltérés azt jelzi, hogy az adatok hova koncentrálódnának, ha mindenki azonos távolságra lenne a számtani átlagtól (1). Egy változó érték eltérésének tekintjük az adott változó értéke és a sorozat számtani átlaga közötti abszolút érték különbségét. Ezért ezt tekintjük az eltérések számtani átlagának (3).

Variancia

A variancia az összes érték algebrai függvénye következtetéses statisztikai feladatokra alkalmas (1). Másodfokú eltérésként (3) definiálható.

Standard vagy tipikus eltérés

Ugyanabból a sokaságból vett minták esetében a szórás az egyik leggyakrabban használt (1). Ez a variancia (3) négyzetgyöke.

Variációs együttható

Ez egy olyan mérőszám, amelyet elsősorban két különböző mértékegységben mért adathalmaz változásának összehasonlítására használnak És. Például magasság és súly tanulók tömege egy mintában. Ennek meghatározására szolgál, hogy az adatok melyik eloszlásban vannak leginkább klaszterezve, és az átlag a legreprezentatívabb (1).

A variációs együttható reprezentatívabb diszperziós index, mint az előzőek, mivel egy absztrakt szám. Más szóval ez független azokkal az egységekkel, amelyekben a változó értékek megjelennek. Ezt a szórási együtthatót általában százalékban fejezik ki (3).

Következtetések a diszperziós indexekről

Az indexek A diszperzió egyrészt jelzi a minta variabilitásának mértékét. Másrészt a központi érték reprezentativitása mivel ha alacsony értéket kap, az azt jelenti, hogy az értékek a középpont körül koncentrálódnak. Ez azt jelentené, hogy az adatokban kevés a változékonyság, és a középpont jól reprezentálja mindezt.

Éppen ellenkezőleg, ha magas értéket kap, az azt jelenti, hogy az értékek nem koncentráltak, hanem szétszórtak. Ez azt jelenti, hogy nagy a változatosság, és a központ nem lesz túl reprezentatív. Másrészt a következtetések levonásához szükségünk van nagyobb mintára, ha akarjuk csökkentse a hibát pont a változékonyság növekedése miatt nőtt.

Népszerű Bejegyzések