Vad är det första vi tänker på när vi ser data? Den första instinkten är att hitta mönster, samband och relationer. Vi tittar på data för att hitta en mening i dem.
Samma sak gäller för forskning, när data väl har samlats in är nästa steg att få insikter ur dem. Om ett klädmärke till exempel försöker identifiera de senaste trenderna bland unga kvinnor kommer märket först att nå ut till unga kvinnor och ställa dem frågor som är relevanta för forskningsmålet. Efter att ha samlat in denna information kommer märket att analysera dessa data för att identifiera mönster – till exempel kan märket upptäcka att de flesta unga kvinnor skulle vilja se fler olika jeans.
Dataanalys är hur forskare går från en massa data till meningsfulla insikter. Det finns många olika dataanalysmetoder, beroende på vilken typ av forskning det handlar om. Här är några metoder som du kan använda för att analysera kvantitativa och kvalitativa data.
Det är svårt att analysera dåliga data. Se till att du samlar in data av hög kvalitet med vår blogg ”4 datainsamlingstekniker”: Which One’s Right for You?”.
Analysera kvantitativa data
Dataförberedelse
Det första steget i analysen av data är dataförberedelse, där målet är att omvandla rådata till något meningsfullt och läsbart. Den omfattar fyra steg:
Steg 1: Datavalidering
Syftet med datavalidering är att i möjligaste mån ta reda på om datainsamlingen har gjorts enligt de på förhand fastställda normerna och utan någon bias. Det är en process i fyra steg som omfattar…
- Bedrägeri, för att härleda om varje respondent faktiskt intervjuades eller inte.
- Screening, för att försäkra sig om att respondenterna valdes ut enligt forskningskriterierna.
- Förfarande, för att kontrollera om datainsamlingsförfarandet följdes på ett korrekt sätt.
- Fullständighet, för att säkerställa att intervjuaren ställde alla frågor till respondenten, snarare än bara några få nödvändiga frågor.
För att göra detta skulle forskarna behöva välja ut ett slumpmässigt urval av genomförda undersökningar och validera de insamlade uppgifterna. (Observera att detta kan vara tidskrävande för undersökningar med många svar.) Tänk dig till exempel en undersökning med 200 respondenter uppdelade på två städer. Forskaren kan ta ett urval av 20 slumpmässiga respondenter från varje stad. Därefter kan forskaren kontakta dem via e-post eller telefon och kontrollera deras svar på en viss uppsättning frågor.
Kolla in 18 datavalideringar som förhindrar att dåliga data hamnar i din datamängd från första början.
Steg 2: Dataredigering
Typiskt sett innehåller stora datamängder fel. Till exempel kan respondenterna fylla i fälten felaktigt eller hoppa över dem av misstag. För att försäkra sig om att det inte finns några sådana fel bör forskaren utföra grundläggande datakontroller, kontrollera om det finns outliers och redigera de obearbetade forskningsdata för att identifiera och rensa ut alla datapunkter som kan försvåra resultatens noggrannhet.
Ett fel kan till exempel vara fält som lämnats tomma av respondenterna. När du redigerar data är det viktigt att se till att ta bort eller fylla i alla tomma fält. (Här finns 4 metoder för att hantera saknade uppgifter.)
Steg 3: Datakodning
Detta är ett av de viktigaste stegen i databearbetningen. Det handlar om att gruppera och tilldela värden till svaren från undersökningen.
Om en forskare till exempel har intervjuat 1 000 personer och nu vill ta reda på respondenternas genomsnittsålder, kommer forskaren att skapa åldershinkar och kategorisera åldern för var och en av respondenterna enligt dessa koder. (Till exempel skulle respondenter mellan 13-15 år ha sin ålder kodad som 0, 16-18 år som 1, 18-20 år som 2 osv.)
Sedan under analysen kan forskaren hantera förenklade åldersgrupper, snarare än ett massivt utbud av individuella åldrar.
Metoder för analys av kvantitativa data
Efter dessa steg är data redo för analys. De två vanligaste metoderna för analys av kvantitativa data är deskriptiv statistik och inferentialstatistik.
Deskriptiv statistik
Typiskt sett är deskriptiv statistik (även kallad beskrivande analys) den första analysnivån. Den hjälper forskarna att sammanfatta data och hitta mönster. Några vanligt förekommande deskriptiv statistik är:
- Medelvärde: numeriskt genomsnitt av en uppsättning värden.
- Median: mittpunkt av en uppsättning numeriska värden.
- Modus: vanligast förekommande värde bland en uppsättning värden.
- Procentandel: används för att uttrycka hur ett värde eller en grupp av respondenter inom data förhåller sig till en större grupp av respondenter.
- Frekvens: antalet gånger ett värde förekommer.
- Intervall: högsta och lägsta värde i en uppsättning värden.
Beskrivande statistik ger absoluta tal. De förklarar dock inte logiken eller resonemanget bakom dessa siffror. Innan du tillämpar deskriptiv statistik är det viktigt att du funderar på vilken som passar bäst för din forskningsfråga och vad du vill visa. Till exempel är en procentsats ett bra sätt att visa könsfördelningen bland respondenterna.
Deskriptiv statistik är mest användbar när forskningen är begränsad till urvalet och inte behöver generaliseras till en större population. Om du till exempel jämför andelen vaccinerade barn i två olika byar räcker det med deskriptiv statistik.
Då deskriptiv analys mestadels används för att analysera en enda variabel kallas den ofta för univariatanalys.
Analysera kvalitativa data
Analysen av kvalitativa data fungerar lite annorlunda än kvantitativa data, framför allt för att kvalitativa data består av ord, observationer, bilder och även symboler. Att härleda absolut mening från sådana data är nästan omöjligt; därför används de mest för utforskande forskning. Medan det i kvantitativ forskning finns en tydlig distinktion mellan dataförberedelse och dataanalys, börjar analysen för kvalitativ forskning ofta så snart data finns tillgängliga.
Dataförberedelse och grundläggande dataanalys
Analys och förberedelse sker parallellt och innefattar följande steg:
- Att bekanta sig med datamaterialet: Eftersom de flesta kvalitativa data bara är ord bör forskaren börja med att läsa data flera gånger för att bekanta sig med dem och börja leta efter grundläggande observationer eller mönster. Detta inkluderar även att transkribera uppgifterna.
- Ompröva forskningsmålen: Här återbesöker forskaren forskningsmålet och identifierar de frågor som kan besvaras med hjälp av de insamlade uppgifterna.
- Utveckling av ett ramverk: Här identifierar forskaren breda idéer, begrepp, beteenden eller fraser och tilldelar dem koder. Till exempel kodning av ålder, kön, socioekonomisk status och även begrepp som positivt eller negativt svar på en fråga. Kodning är till hjälp för att strukturera och märka data.
- Identifiera mönster och samband: När data är kodade kan forskningen börja identifiera teman, leta efter de vanligaste svaren på frågor, identifiera data eller mönster som kan besvara forskningsfrågor och hitta områden som kan utforskas ytterligare.
Metoder för analys av kvalitativa data
Flera metoder finns tillgängliga för att analysera kvalitativa data. De vanligaste metoderna för dataanalys är:
- Innehållsanalys: Detta är en av de vanligaste metoderna för att analysera kvalitativa data. Den används för att analysera dokumenterad information i form av texter, medier eller till och med fysiska föremål. När den här metoden ska användas beror på forskningsfrågorna. Innehållsanalys används vanligtvis för att analysera svar från intervjupersoner.
- Narrativ analys: Denna metod används för att analysera innehåll från olika källor, t.ex. intervjuer med respondenter, observationer från fältet eller undersökningar. Den fokuserar på att använda de berättelser och erfarenheter som människor delar med sig av för att besvara forskningsfrågorna.
- Diskursanalys: Liksom narrativ analys används diskursanalys för att analysera interaktioner med människor. Den fokuserar dock på att analysera det sociala sammanhang i vilket kommunikationen mellan forskaren och respondenten ägde rum. Diskursanalysen tittar också på respondentens vardagsmiljö och använder den informationen under analysen.
- Grundad teori: Detta avser användning av kvalitativa data för att förklara varför ett visst fenomen inträffade. Detta görs genom att studera en mängd liknande fall i olika miljöer och använda uppgifterna för att härleda orsaksförklaringar. Forskarna kan ändra förklaringarna eller skapa nya när de studerar fler fall tills de kommer fram till en förklaring som passar alla fall.
Dessa metoder är de som används mest frekvent. Det finns dock även andra dataanalysmetoder, t.ex. samtalsanalys.
Dataanalys är kanske den viktigaste komponenten i forskningen. En svag analys ger felaktiga resultat som inte bara försvårar forskningens äkthet utan också gör resultaten oanvändbara. Det är absolut nödvändigt att välja dina dataanalysmetoder med omsorg för att säkerställa att dina resultat är insiktsfulla och användbara.
Header photo by Brittany Colette on Unsplash
.