De exemplu, să presupunem că un experiment constă în aflarea greutății șobolanilor de laborator și că valorile în grame sunt 320, 367, 423, 471 și 480. În acest caz, intervalul se calculează pur și simplu ca fiind 480-320 = 160 de grame.
Câteva limitări ale intervalului
Intervalul este o indicație destul de utilă pentru a arăta cât de răspândite sunt datele, dar are câteva limitări serioase. Acest lucru se datorează faptului că, uneori, datele pot avea valori aberante care sunt foarte îndepărtate de celelalte puncte de date. În aceste cazuri, este posibil ca intervalul să nu ofere o indicație reală a răspândirii datelor.
De exemplu, în cazul nostru anterior, să luăm în considerare un mic pui de șobolan adăugat la setul de date care cântărește doar 50 de grame. Acum intervalul este calculat ca fiind 480-50 = 430 de grame, ceea ce pare a fi o indicație falsă a dispersiei datelor.
Această limitare a intervalului este de așteptat în primul rând pentru că intervalul este calculat luând în considerare doar două puncte de date. Astfel, nu poate oferi o estimare foarte bună a modului în care se comportă datele în ansamblu.
Utilitatea practică a intervalului
În foarte multe cazuri, totuși, datele sunt strâns grupate și dacă numărul de observații este foarte mare, atunci acesta poate oferi o idee bună despre distribuția datelor. De exemplu, luați în considerare un sondaj uriaș privind nivelurile de IQ ale studenților universitari, format din 10.000 de studenți din medii diferite. În acest caz, intervalul poate fi un instrument util pentru a măsura dispersia valorilor IQ în rândul studenților universitari.
Câteodată, definim intervalul în așa fel încât să eliminăm valorile aberante și punctele extreme din setul de date. De exemplu, intervalul interquartil în statistică este definit ca fiind diferența dintre al treilea și primul cuartil. Puteți vedea imediat cum această nouă definiție a intervalului este mai robustă decât cea anterioară. Aici valorile aberante nu vor conta, iar această definiție ia în considerare întreaga distribuție a datelor și nu doar valorile maxime și minime.
Trebuie subliniat faptul că, în ciuda mai multor limitări, intervalul poate fi o indicație utilă pentru multe cazuri. În calitate de student la statistică, ar trebui să înțelegeți ce tipuri de date sunt cele mai potrivite pentru a fi definite pe baza intervalului. Dacă există prea multe valori aberante, s-ar putea să nu fie o idee bună. Dar intervalul oferă o indicație rapidă și ușor de estimat despre răspândirea datelor.
.