Intervallo in statistica – La differenza tra il massimo e il minimo

author
1 minute, 46 seconds Read

Per esempio, supponiamo che un esperimento riguardi la determinazione del peso dei topi da laboratorio e che i valori in grammi siano 320, 367, 423, 471 e 480. In questo caso, l’intervallo è semplicemente calcolato come 480-320 = 160 grammi.

Alcune limitazioni dell’intervallo

L’intervallo è un’indicazione abbastanza utile di quanto sono diffusi i dati, ma ha alcuni seri limiti. Questo perché a volte i dati possono avere outlier che sono molto lontani dagli altri punti di dati. In questi casi, l’intervallo potrebbe non dare una vera indicazione della diffusione dei dati.

Per esempio, nel nostro caso precedente, consideriamo un piccolo topo aggiunto al set di dati che pesa solo 50 grammi. Ora l’intervallo viene calcolato come 480-50 = 430 grammi, che sembra una falsa indicazione della dispersione dei dati.

Questa limitazione dell’intervallo è da aspettarsi principalmente perché l’intervallo viene calcolato prendendo in considerazione solo due punti dati. Quindi non può dare una stima molto buona di come si comportano i dati complessivi.

Utilità pratica di Range

In molti casi, tuttavia, i dati sono strettamente raggruppati e se il numero di osservazioni è molto grande, allora può dare un buon senso della distribuzione dei dati. Per esempio, si consideri un enorme sondaggio sui livelli di QI degli studenti universitari composto da 10.000 studenti di diversa provenienza. In questo caso, l’intervallo può essere uno strumento utile per misurare la dispersione dei valori del QI tra gli studenti universitari.

A volte, definiamo l’intervallo in modo tale da eliminare gli outlier e i punti estremi nel set di dati. Per esempio, l’intervallo interquartile in statistica è definito come la differenza tra il terzo e il primo quartile. Si può subito vedere come questa nuova definizione di intervallo sia più robusta della precedente. Qui gli outlier non hanno importanza e questa definizione prende in considerazione l’intera distribuzione dei dati e non solo i valori massimi e minimi.

Si deve sottolineare che, nonostante diverse limitazioni, l’intervallo può essere un’indicazione utile per molti casi. Come studente di statistica dovresti capire quali tipi di dati sono più adatti ad essere definiti in base al range. Se ci sono troppi outlier, potrebbe non essere una buona idea. Ma l’intervallo dà un’indicazione rapida e facile da stimare sulla diffusione dei dati.

Similar Posts

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.