Vaihteluväli tilastotieteessä – maksimin ja minimin ero

author
1 minute, 41 seconds Read

Esitetään esimerkiksi, että kokeessa selvitetään laboratoriorottien paino, ja arvot grammoina ovat 320, 367, 423, 471 ja 480. Tällöin vaihteluväli lasketaan yksinkertaisesti seuraavasti: 480-320 = 160 grammaa.

Vaihteluvälin joitain rajoituksia

Vaihteluväli on varsin hyödyllinen osoitus siitä, kuinka hajallaan aineisto on, mutta sillä on joitain vakavia rajoituksia. Tämä johtuu siitä, että joskus datassa voi olla poikkeamia, jotka ovat kaukana muista datapisteistä. Näissä tapauksissa vaihteluväli ei välttämättä anna todellista tietoa datan hajonnasta.

Edellisessä tapauksessamme tarkastellaan esimerkiksi aineistoon lisättyä pientä rotanpoikasta, joka painaa vain 50 grammaa. Nyt vaihteluväliksi lasketaan 480-50 = 430 grammaa, mikä näyttää väärältä osoitukselta datan hajonnasta.

Tämä vaihteluvälin rajoittuneisuus on odotettavissa lähinnä siksi, että vaihteluväli lasketaan ottaen huomioon vain kaksi datapistettä. Näin ollen se ei voi antaa kovin hyvää arviota siitä, miten koko data käyttäytyy.

Välivaihteluvälin käytännöllinen käyttökelpoisuus

Paljon tapauksia on kuitenkin, että data on tiiviisti klusteroitunut ja jos havaintojen määrä on hyvin suuri, se voi antaa hyvän käsityksen datan jakaumasta. Ajatellaan esimerkiksi valtavaa yliopisto-opiskelijoiden älykkyysosamäärää koskevaa tutkimusta, joka koostuu 10 000:sta eri taustoista tulevasta opiskelijasta. Tässä tapauksessa vaihteluväli voi olla hyödyllinen väline mittaamaan älykkyysosamääräarvojen hajontaa yliopisto-opiskelijoiden keskuudessa.

Joskus määrittelemme vaihteluvälin siten, että poistamme aineistosta ulokkeet ja ääripisteet. Esimerkiksi tilastoissa kvartiilien välinen vaihteluväli määritellään kolmannen ja ensimmäisen kvartiilin väliseksi erotukseksi. Voit heti nähdä, miten tämä uusi vaihteluvälin määritelmä on vahvempi kuin edellinen. Tässä poikkeavilla arvoilla ei ole merkitystä, ja tämä määritelmä ottaa huomioon koko aineiston jakauman eikä vain maksimi- ja minimiarvoja.

On syytä huomauttaa, että useista rajoituksista huolimatta vaihteluväli voi olla hyödyllinen indikaattori monissa tapauksissa. Tilastotieteen opiskelijana sinun tulisi ymmärtää, millaiset aineistot soveltuvat parhaiten määriteltäväksi vaihteluvälin perusteella. Jos poikkeavia arvoja on liikaa, se ei välttämättä ole hyvä idea. Mutta vaihteluväli antaa nopeasti ja helposti arvioitavissa olevan viitteen datan hajonnasta.

Similar Posts

Vastaa

Sähköpostiosoitettasi ei julkaista.