Zakres w statystyce – różnica między maksimum a minimum

Na przykład, załóżmy, że eksperyment polega na ustaleniu wagi szczurów laboratoryjnych, a wartości w gramach wynoszą 320, 367, 423, 471 i 480. W tym przypadku zakres jest po prostu obliczany jako 480-320 = 160 gramów.

Niektóre ograniczenia zakresu

Zakres jest dość użytecznym wskaźnikiem tego, jak bardzo dane są rozproszone, ale ma pewne poważne ograniczenia. Dzieje się tak dlatego, że czasami dane mogą mieć wartości skrajne, które znacznie odbiegają od innych punktów danych. W tych przypadkach, zakres może nie dać prawdziwego wskazania rozprzestrzeniania się danych.

Na przykład, w naszym poprzednim przypadku, rozważ mały szczur dziecka dodany do zestawu danych, który waży tylko 50 gramów. Teraz zakres jest obliczany jako 480-50 = 430 gramów, co wygląda jak fałszywe wskazanie rozproszenia danych.

Tego ograniczenia zakresu należy się spodziewać przede wszystkim dlatego, że zakres jest obliczany z uwzględnieniem tylko dwóch punktów danych. Dlatego nie może on dać bardzo dobrego oszacowania tego, jak zachowują się ogólne dane.

Praktyczna użyteczność zakresu

W wielu przypadkach jednak dane są ściśle skupione i jeśli liczba obserwacji jest bardzo duża, to może on dać dobre poczucie dystrybucji danych. Na przykład, rozważ ogromne badanie poziomów IQ studentów uniwersytetu składające się z 10,000 studentów z różnych środowisk. W tym przypadku zakres może być użytecznym narzędziem do pomiaru rozproszenia wartości IQ wśród studentów uniwersytetu.

Czasami definiujemy zakres w taki sposób, aby wyeliminować punkty skrajne i ekstremalne w zbiorze danych. Na przykład, zakres międzykwartylowy w statystyce jest definiowany jako różnica między trzecim i pierwszym kwartylem. Możesz natychmiast zobaczyć, jak ta nowa definicja zakresu jest bardziej wytrzymała niż poprzednia. Tutaj wartości odstające nie będą miały znaczenia i ta definicja bierze pod uwagę cały rozkład danych, a nie tylko wartości maksymalne i minimalne.

Należy podkreślić, że pomimo kilku ograniczeń, zakres może być użytecznym wskaźnikiem dla wielu przypadków. Jako student statystyki powinieneś zrozumieć, jakie rodzaje danych najlepiej nadają się do zdefiniowania na podstawie zakresu. Jeśli jest zbyt wiele wartości odstających, może to nie być dobry pomysł. Ale zakres daje szybkie i łatwe do oszacowania wskazanie na temat rozprzestrzeniania się danych.

Similar Posts

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.