Rozsah ve statistice – rozdíl mezi maximem a minimem

author
2 minutes, 2 seconds Read

Předpokládejme například, že v experimentu zjišťujeme hmotnost laboratorních potkanů a hodnoty v gramech jsou 320, 367, 423, 471 a 480. V tomto případě se rozsah jednoduše vypočítá jako 480-320 = 160 gramů.

Některá omezení rozsahu

Rozsah je poměrně užitečným ukazatelem toho, jak jsou data rozprostřena, ale má některá závažná omezení. Je to proto, že někdy mohou mít data odlehlé hodnoty, které jsou značně vzdálené od ostatních datových bodů. V těchto případech nemusí rozsah poskytovat pravdivý údaj o rozptylu dat.

Příklad v našem předchozím případě uvažujme malé krysí mládě přidané do souboru dat, které váží pouze 50 gramů. Nyní je rozsah vypočten jako 480-50 = 430 gramů, což vypadá jako nepravdivý údaj o rozptylu dat.

Toto omezení rozsahu lze očekávat především proto, že rozsah je počítán s ohledem pouze na dva datové body. Nemůže tedy poskytnout velmi dobrý odhad toho, jak se chovají celková data.

Praktická využitelnost rozsahu

V mnoha případech jsou však data těsně seskupena a pokud je počet pozorování velmi velký, pak může poskytnout dobrou představu o rozložení dat. Uvažujme například rozsáhlý průzkum úrovně IQ vysokoškolských studentů, který se skládá z 10 000 studentů z různých prostředí. V tomto případě může být rozsah užitečným nástrojem pro měření rozptylu hodnot IQ mezi vysokoškolskými studenty.

Někdy definujeme rozsah tak, abychom eliminovali odlehlé a extrémní body v souboru dat. Například mezikvartilové rozpětí je ve statistice definováno jako rozdíl mezi třetím a prvním kvartilem. Ihned vidíte, jak je tato nová definice rozsahu robustnější než ta předchozí. Zde nebudou vadit odlehlé hodnoty a tato definice bere v úvahu celé rozdělení dat a ne pouze maximální a minimální hodnoty.

Je třeba zdůraznit, že i přes několik omezení může být rozsah užitečným ukazatelem pro mnoho případů. Jako student statistiky byste měli pochopit, jaké druhy dat je nejvhodnější definovat na základě rozsahu. Pokud je příliš mnoho odlehlých hodnot, nemusí to být dobrý nápad. Rozsah však poskytuje rychlý a snadno odhadnutelný údaj o rozptylu dat.

Similar Posts

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.