Tartomány a statisztikában – A maximum és a minimum közötti különbség

author
2 minutes, 24 seconds Read

Tegyük fel például, hogy egy kísérlet során laboratóriumi patkányok súlyát kell meghatározni, és az értékek grammban kifejezve 320, 367, 423, 471 és 480 gramm. Ebben az esetben a tartományt egyszerűen úgy számoljuk ki, hogy 480-320 = 160 gramm.

A tartomány néhány korlátja

A tartomány meglehetősen hasznos mutatója annak, hogy mennyire szóródnak az adatok, de van néhány komoly korlátja. Ennek oka, hogy néha az adatoknak lehetnek olyan kiugró értékei, amelyek nagymértékben eltérnek a többi adatponttól. Ezekben az esetekben a tartomány nem feltétlenül ad valós jelzést az adatok szórásáról.

Előző esetünkben például tekintsünk egy kis patkánybébit, amelyet hozzáadtunk az adathalmazhoz, és amely mindössze 50 grammot nyom. Most a tartományt 480-50 = 430 grammként számoljuk ki, ami hamisan jelzi az adatok szórását.

A tartománynak ez a korlátozása elsősorban azért várható, mert a tartományt csak két adatpont figyelembevételével számítjuk ki. Így nem tud nagyon jó becslést adni arról, hogyan viselkednek az adatok összességében.

A tartomány gyakorlati haszna

Egy csomó esetben azonban az adatok szorosan csoportosulnak, és ha a megfigyelések száma nagyon nagy, akkor jó képet adhat az adatok eloszlásáról. Vegyünk például egy hatalmas felmérést az egyetemi hallgatók IQ-szintjéről, amely 10 000 különböző hátterű hallgatóból áll. Ebben az esetben a tartomány hasznos eszköz lehet az IQ-értékek szórásának mérésére az egyetemi hallgatók között.

Néha a tartományt úgy határozzuk meg, hogy az adathalmazból kiszűrjük a kiugró és szélsőséges pontokat. Például a statisztikában az interkvartilis tartományt a harmadik és az első kvartilis közötti különbségként határozzák meg. Azonnal láthatja, hogy a tartománynak ez az új definíciója robusztusabb, mint az előző. Itt a kiugró értékek nem számítanak, és ez a definíció az adatok teljes eloszlását veszi figyelembe, nem csak a maximális és minimális értékeket.

Meg kell jegyezni, hogy számos korlátozása ellenére a tartomány sok esetben hasznos jelzés lehet. Statisztikát tanuló diákként meg kell értenie, hogy milyen típusú adatokat lehet a legjobban a tartomány alapján meghatározni. Ha túl sok a kiugró érték, nem biztos, hogy jó ötlet. A tartomány azonban gyorsan és könnyen becsülhető jelzést ad az adatok szórásáról.

Similar Posts

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.