Kvalitatiivisen ja kvantitatiivisen datan analyysimenetelmien opas

author
5 minutes, 59 seconds Read

Mikä tulee ensimmäisenä mieleen, kun näemme datan? Ensimmäinen vaisto on löytää kuvioita, yhteyksiä ja suhteita. Tarkastelemme dataa löytääkseen siitä merkityksen.

Tutkimuksessa on vastaavasti niin, että kun data on kerätty, seuraava askel on saada siitä oivalluksia. Jos esimerkiksi vaatemerkki yrittää selvittää viimeisimpiä trendejä nuorten naisten keskuudessa, tuotemerkki tavoittaa ensin nuoria naisia ja kysyy heiltä tutkimustavoitteen kannalta olennaisia kysymyksiä. Kun nämä tiedot on kerätty, tuotemerkki analysoi tiedot havaitakseen malleja – se voi esimerkiksi havaita, että useimmat nuoret naiset haluaisivat nähdä enemmän erilaisia farkkuja.

Data-analyysi on tapa, jolla tutkijat siirtyvät tietomassasta merkityksellisiin oivalluksiin. On olemassa monia erilaisia data-analyysimenetelmiä tutkimustyypistä riippuen. Seuraavassa on muutamia menetelmiä, joita voit käyttää kvantitatiivisen ja kvalitatiivisen datan analysointiin.

Pahaa dataa on vaikea analysoida. Varmista, että keräät laadukasta dataa blogimme ”4 tiedonkeruutekniikkaa” avulla: Which One’s Right for You?”.

Kvantitatiivisen datan analysointi

Datan valmistelu

Datan analysoinnin ensimmäinen vaihe on datan valmistelu, jossa raakadata pyritään muuttamaan mielekkääksi ja luettavaksi. Siihen kuuluu neljä vaihetta:

Vaihe 1: Aineiston validointi

Aineiston validoinnin tarkoituksena on selvittää mahdollisuuksien mukaan, onko aineistonkeruu tehty ennalta asetettujen standardien mukaisesti ja ilman harhaa. Se on nelivaiheinen prosessi, johon kuuluu…

  • Petos, jotta voidaan päätellä, onko kutakin vastaajaa todella haastateltu vai ei.
  • Seulonta, jotta voidaan varmistaa, että vastaajat valittiin tutkimuskriteerien mukaisesti.
  • Menettelytapa, jotta voidaan tarkastaa, onko aineistonkeruumenettelyä noudatettu asianmukaisesti.
  • Täydellisyys, sen varmistaminen, että haastattelija esitti vastaajalle kaikki kysymykset eikä vain muutamia vaadittuja kysymyksiä.

Tätä varten tutkijoiden olisi poimittava satunnaisotos valmiista tutkimuksista ja validoitava kerätyt tiedot. (Huomaa, että tämä voi olla aikaa vievää kyselyissä, joissa on paljon vastauksia.) Kuvitellaan esimerkiksi kysely, jossa on 200 vastaajaa jaettuna kahteen kaupunkiin. Tutkija voi valita 20 satunnaisen vastaajan otoksen kummastakin kaupungista. Tämän jälkeen tutkija voi ottaa heihin yhteyttä sähköpostitse tai puhelimitse ja tarkistaa heidän vastauksensa tiettyyn kysymyssarjaan.

Katso 18 datan validointia, jotka estävät huonojen tietojen lipsahtamisen aineistoosi alun perin.

Vaihe 2: Datan muokkaus

Tyypillisesti suuret aineistot sisältävät virheitä. Vastaajat saattavat esimerkiksi täyttää kenttiä väärin tai ohittaa niitä vahingossa. Varmistaakseen, että tällaisia virheitä ei ole, tutkijan tulisi tehdä aineiston perustarkistuksia, tarkastaa poikkeavat arvot (outliers) ja muokata tutkimuksen raakadataa tunnistamaan ja poistamaan aineistosta kohtia, jotka voivat haitata tulosten tarkkuutta.

Virhe voi olla esimerkiksi kentät, jotka vastaajat ovat jättäneet tyhjiksi. Aineistoa muokattaessa on tärkeää varmistaa, että kaikki tyhjät kentät poistetaan tai täytetään. (Tässä on 4 menetelmää puuttuvien tietojen käsittelyyn.)

Vaihe 3: Tietojen koodaus

Tämä on yksi tärkeimmistä vaiheista tietojen valmistelussa. Sillä tarkoitetaan tutkimuksen vastausten ryhmittelyä ja arvojen antamista niille.

Jos tutkija on esimerkiksi haastatellut 1000 ihmistä ja haluaa nyt selvittää vastaajien keski-ikä, tutkija luo ikäkaukaloita ja luokittelee kunkin vastaajan iän näiden koodien mukaisesti. (Esimerkiksi 13-15-vuotiaiden vastaajien ikä koodataan 0:ksi, 16-18-vuotiaiden 1:ksi, 18-20-vuotiaiden 2:ksi jne.)

Tällöin tutkija voi analyysin aikana käsitellä yksinkertaistettuja ikäluokkia eikä massiivista yksittäisten ikäluokkien valikoimaa.

Kvantitatiivisen aineiston analyysimenetelmät

Näiden vaiheiden jälkeen aineisto on valmis analysoitavaksi. Kaksi yleisimmin käytettyä kvantitatiivisen aineiston analyysimenetelmää ovat kuvaileva tilastotiede ja päättelytilastot.

Kuvaileva tilastotiede

Tyypillisesti kuvaileva tilastotiede (tunnetaan myös nimellä kuvaileva analyysi) on analyysin ensimmäinen taso. Se auttaa tutkijoita tiivistämään tietoja ja löytämään kuvioita. Muutamia yleisesti käytettyjä kuvailevia tilastoja ovat:

  • Keskiarvo: arvojoukon numeerinen keskiarvo.
  • Mediaani: arvojoukon keskikohta.
  • Moodi: arvojoukon yleisin arvo.
  • Prosenttiosuus: käytetään ilmaisemaan, miten aineistossa oleva arvo tai vastaajaryhmä suhteutuu suurempaan vastaajaryhmään.
  • Frekvenssi: kuinka monta kertaa jokin arvo esiintyy.
  • Vaihteluväli: arvojoukon korkein ja matalin arvo.

Kuvailevat tilastot antavat absoluuttisia lukuja. Ne eivät kuitenkaan selitä näiden lukujen taustalla olevia perusteita tai päättelyä. Ennen kuvailevien tilastojen soveltamista on tärkeää miettiä, mikä niistä sopii parhaiten tutkimuskysymykseesi ja siihen, mitä haluat näyttää. Esimerkiksi prosenttiosuus on hyvä tapa osoittaa vastaajien sukupuolijakauma.

Kuvailevat tilastot ovat hyödyllisimpiä silloin, kun tutkimus rajoittuu otokseen eikä sitä tarvitse yleistää suurempaan perusjoukkoon. Jos esimerkiksi verrataan rokotettujen lasten prosenttiosuutta kahdessa eri kylässä, kuvaileva tilastointi riittää.

Koska kuvailevaa analyysia käytetään useimmiten yhden muuttujan analysointiin, sitä kutsutaan usein yksimuuttuja-analyysiksi.

Laadullisen aineiston analysointi

Kvalitatiivisen aineiston analyysi toimii hiukan eri tavalla kuin kvantitatiivisen aineiston analyysi, ennen kaikkea siksi, että kvalitatiivinen aineisto koostuu sanoista, havainnoista, kuvista, ja jopa symboleista. Absoluuttisen merkityksen johtaminen tällaisesta aineistosta on lähes mahdotonta; siksi sitä käytetään lähinnä eksploratiivisessa tutkimuksessa. Vaikka kvantitatiivisessa tutkimuksessa on selvä ero aineiston valmistelu- ja analyysivaiheen välillä, laadullisen tutkimuksen analyysi alkaa usein heti, kun aineisto on käytettävissä.

Aineiston valmistelu ja aineiston perusanalyysi

Analyysi ja aineiston valmistelu tapahtuvat rinnakkain, ja niihin kuuluvat seuraavat vaiheet:

  1. Aineistoon tutustuminen: Koska suurin osa laadullisesta aineistosta on pelkkiä sanoja, tutkijan tulisi aloittaa lukemalla aineisto useita kertoja tutustuakseen siihen ja ryhtyäkseen etsimään perushavaintoja tai -malleja. Tähän kuuluu myös aineiston puhtaaksikirjoittaminen.
  2. Tutkimustavoitteiden tarkistaminen: Tässä tutkija käy uudelleen läpi tutkimustavoitteen ja yksilöi kysymykset, joihin voidaan vastata kerätyn aineiston avulla.
  3. Kehyksen kehittäminen: Tunnetaan myös nimellä koodaus tai indeksointi, tässä tutkija tunnistaa laajoja ideoita, käsitteitä, käyttäytymismalleja tai lauseita ja antaa niille koodeja. Esimerkiksi iän, sukupuolen, sosioekonomisen aseman ja jopa sellaisten käsitteiden koodaaminen kuin myönteinen tai kielteinen vastaus kysymykseen. Koodauksesta on apua aineiston jäsentämisessä ja merkitsemisessä.
  4. Kuvioiden ja yhteyksien tunnistaminen: Kun aineisto on koodattu, tutkimuksessa voidaan alkaa tunnistaa teemoja, etsiä yleisimpiä vastauksia kysymyksiin, tunnistaa tietoja tai malleja, jotka voivat vastata tutkimuskysymyksiin, ja löytää alueita, joita voidaan tutkia tarkemmin.

Kvalitatiivisen aineiston analyysimenetelmät

Kvalitatiivisen aineiston analysoimiseksi on käytettävissä useita menetelmiä. Yleisimmin käytettyjä aineiston analyysimenetelmiä ovat:

  • Sisällönanalyysi: Tämä on yksi yleisimmistä laadullisen aineiston analyysimenetelmistä. Sitä käytetään analysoimaan dokumentoitua tietoa tekstien, median tai jopa fyysisten esineiden muodossa. Se, milloin tätä menetelmää käytetään, riippuu tutkimuskysymyksistä. Sisällönanalyysia käytetään yleensä haastateltavien vastausten analysointiin.
  • Narratiivinen analyysi: Tätä menetelmää käytetään analysoimaan sisältöä eri lähteistä, kuten vastaajien haastatteluista, kentältä tehdyistä havainnoista tai kyselyistä. Siinä keskitytään käyttämään ihmisten jakamia tarinoita ja kokemuksia tutkimuskysymyksiin vastaamiseksi.
  • Diskurssianalyysi: Narratiivisen analyysin tavoin diskurssianalyysia käytetään ihmisten kanssa käytävän vuorovaikutuksen analysointiin. Siinä keskitytään kuitenkin analysoimaan sosiaalista kontekstia, jossa tutkijan ja vastaajan välinen viestintä tapahtui. Diskurssianalyysissä tarkastellaan myös vastaajan jokapäiväistä ympäristöä ja käytetään tätä tietoa analyysin aikana.
  • Grounded theory: Tällä tarkoitetaan laadullisen aineiston käyttämistä selittämään, miksi tietty ilmiö tapahtui. Se tekee tämän tutkimalla useita samankaltaisia tapauksia eri ympäristöissä ja käyttämällä aineistoa kausaalisten selitysten johtamiseen. Tutkijat voivat muuttaa selityksiä tai luoda uusia selityksiä tutkiessaan yhä useampia tapauksia, kunnes he löytävät selityksen, joka sopii kaikkiin tapauksiin.

Näitä menetelmiä käytetään yleisimmin. Käytettävissä on kuitenkin myös muita aineiston analyysimenetelmiä, kuten keskustelunanalyysi.

Aineiston analyysi on ehkä tutkimuksen tärkein osa-alue. Heikko analyysi tuottaa epätarkkoja tuloksia, jotka paitsi haittaavat tutkimuksen aitoutta myös tekevät tuloksista käyttökelvottomia. On ehdottoman tärkeää valita data-analyysimenetelmät huolellisesti, jotta voit varmistaa, että tuloksesi ovat oivaltavia ja käyttökelpoisia.

Header photo by Brittany Colette on Unsplash

Similar Posts

Vastaa

Sähköpostiosoitettasi ei julkaista.