Spændvidde i statistik – forskellen mellem maksimum og minimum

author
1 minute, 58 seconds Read

Fors eksempel: Lad os antage, at et forsøg går ud på at finde ud af vægten af forsøgsrotter, og at værdierne i gram er 320, 367, 423, 471 og 480. I dette tilfælde beregnes intervallet simpelthen som 480-320 = 160 gram.

Nogle begrænsninger ved intervallet

Afstanden er en ganske nyttig indikation af, hvor spredte dataene er, men den har nogle alvorlige begrænsninger. Det skyldes, at data nogle gange kan have outliers, der ligger langt fra de andre datapunkter. I disse tilfælde giver intervallet måske ikke en sand indikation af spredningen af dataene.

Tænk f.eks. i vores tidligere tilfælde på en lille babyrotte, der er tilføjet til datasættet, og som kun vejer 50 gram. Nu beregnes intervallet som 480-50 = 430 gram, hvilket ligner en falsk indikation af spredningen af dataene.

Denne begrænsning af intervallet er primært at forvente, fordi intervallet beregnes ved kun at tage hensyn til to datapunkter. Derfor kan det ikke give et særligt godt skøn over, hvordan de samlede data opfører sig.

Praktisk nytteværdi af range

I mange tilfælde er data dog tæt grupperet, og hvis antallet af observationer er meget stort, så kan det give en god fornemmelse af datafordelingen. For eksempel kan man overveje en stor undersøgelse af universitetsstuderendes IQ-niveau bestående af 10.000 studerende med forskellige baggrunde. I dette tilfælde kan intervallet være et nyttigt redskab til at måle spredningen af IQ-værdierne blandt universitetsstuderende.

Sommetider definerer vi intervallet på en sådan måde, at vi eliminerer outliers og ekstreme punkter i datasættet. F.eks. defineres interkvartilområdet i statistik som forskellen mellem den tredje og første kvartil. Man kan straks se, hvordan denne nye definition af interval er mere robust end den tidligere. Her vil outliers ikke have nogen betydning, og denne definition tager hele fordelingen af data i betragtning og ikke kun maksimum- og minimumsværdierne.

Det skal understreges, at på trods af flere begrænsninger kan intervallet være en nyttig indikation i mange tilfælde. Som studerende i statistik bør du forstå, hvilke typer data der er bedst egnede til at blive defineret på grundlag af interval. Hvis der er for mange outliers, er det måske ikke en god idé. Men range giver en hurtig og let at estimere indikation om spredningen af data.

Similar Posts

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.