Intervall i statistik – skillnaden mellan maximum och minimum

author
2 minutes, 4 seconds Read

Antag till exempel att ett experiment går ut på att ta reda på vikten hos labbråttor och att värdena i gram är 320, 367, 423, 471 och 480. I det här fallet beräknas intervallet helt enkelt som 480-320 = 160 gram.

Somliga begränsningar av intervallet

Avståndet är en ganska användbar indikation på hur spridda data är, men det har några allvarliga begränsningar. Detta beror på att data ibland kan ha outliers som ligger långt ifrån de andra datapunkterna. I dessa fall kanske intervallet inte ger en sann indikation på hur spridda data är.

Till exempel, i vårt tidigare fall, tänk på en liten råttunge som läggs till datamängden och som bara väger 50 gram. Nu beräknas intervallet som 480-50 = 430 gram, vilket ser ut som en falsk indikation på spridningen av data.

Denna begränsning av intervallet är att förvänta främst på grund av att intervallet beräknas med hänsyn till endast två datapunkter. Därför kan det inte ge en särskilt bra uppskattning av hur de övergripande data beter sig.

Praktisk nytta av intervall

I många fall är dock data tätt klustrade, och om antalet observationer är mycket stort, så kan det ge en bra känsla för datafördelningen. Tänk till exempel på en stor undersökning av universitetsstudenters IQ-nivåer som består av 10 000 studenter med olika bakgrund. I det här fallet kan intervallet vara ett användbart verktyg för att mäta spridningen av IQ-värdena bland universitetsstudenterna.

Ibland definierar vi intervallet på ett sådant sätt att vi eliminerar outliers och extrema punkter i datamängden. Till exempel definieras interkvartilområdet i statistiken som skillnaden mellan den tredje och första kvartilen. Du kan omedelbart se hur denna nya definition av intervallet är mer robust än den tidigare. Här spelar outliers ingen roll och den här definitionen tar hänsyn till hela datafördelningen och inte bara till maximi- och minimivärdena.

Det bör påpekas att trots flera begränsningar kan intervallet vara en användbar indikation i många fall. Som statistikstuderande bör du förstå vilka typer av data som är bäst lämpade att definieras utifrån intervallet. Om det finns för många outliers är det kanske inte en bra idé. Men intervallet ger en snabb och lätt att uppskatta indikation om spridningen av data.

Similar Posts

Lämna ett svar

Din e-postadress kommer inte publiceras.