Por exemplo, suponha que uma experiência envolve descobrir o peso de ratos de laboratório e os valores em gramas são 320, 367, 423, 471 e 480. Neste caso, o intervalo é simplesmente calculado como 480-320 = 160 gramas.
algumas limitações do intervalo
O intervalo é uma indicação bastante útil de como os dados estão espalhados, mas tem algumas limitações sérias. Isto é porque às vezes os dados podem ter outliers que estão amplamente fora dos outros pontos de dados. Nesses casos, o intervalo pode não dar uma indicação verdadeira da dispersão dos dados.
Por exemplo, no nosso caso anterior, considere um pequeno rato bebé adicionado ao conjunto de dados que pesa apenas 50 gramas. Agora o intervalo é calculado como 480-50 = 430 gramas, o que parece uma falsa indicação da dispersão de dados.
Esta limitação do intervalo é esperada principalmente porque o intervalo é calculado levando apenas dois pontos de dados em consideração. Assim, ele não pode dar uma estimativa muito boa de como os dados gerais se comportam.
Utilidade prática do intervalo
Em muitos casos, no entanto, os dados são agrupados de perto e se o número de observações for muito grande, então ele pode dar uma boa sensação de distribuição de dados. Por exemplo, considere um grande levantamento dos níveis de QI dos estudantes universitários composto por 10.000 estudantes de diferentes origens. Neste caso, o intervalo pode ser uma ferramenta útil para medir a dispersão de valores de QI entre estudantes universitários.
Por vezes, definimos o intervalo de forma a eliminar os outliers e pontos extremos no conjunto de dados. Por exemplo, o intervalo interquartílico em estatística é definido como a diferença entre o terceiro e o primeiro quartil. Você pode ver imediatamente como esta nova definição de intervalo é mais robusta do que a anterior. Aqui os outliers não terão importância e esta definição leva em consideração toda a distribuição de dados e não apenas os valores máximos e mínimos.
Deve-se salientar que apesar de várias limitações, o intervalo pode ser uma indicação útil para muitos casos. Como estudante de estatística você deve entender que tipos de dados são mais adequados para serem definidos com base no intervalo. Se houver muitos outliers, pode não ser uma boa ideia. Mas o intervalo dá uma indicação rápida e fácil de estimar sobre a propagação dos dados.