Mi jut először eszünkbe, ha adatokat látunk? Az első ösztönünk az, hogy mintákat, kapcsolatokat és összefüggéseket találjunk. Azért nézzük az adatokat, hogy értelmet találjunk bennük.”
Hasonlóan a kutatásban is, ha az adatokat összegyűjtöttük, a következő lépés az, hogy meglátásokat nyerjünk belőlük. Ha például egy ruházati márka megpróbálja azonosítani a legújabb trendeket a fiatal nők körében, akkor a márka először fiatal nőket keres meg, és a kutatási cél szempontjából releváns kérdéseket tesz fel nekik. Miután összegyűjtötte ezeket az információkat, a márka elemzi az adatokat a minták azonosítása érdekében – például felfedezheti, hogy a legtöbb fiatal nő többféle farmert szeretne látni.
Az adatelemzés az, ahogyan a kutatók az adatok tömegéből értelmes meglátásokhoz jutnak. A kutatás típusától függően számos különböző adatelemzési módszer létezik. Íme néhány módszer, amelyet a kvantitatív és kvalitatív adatok elemzésére használhat.
Nehéz elemezni a rossz adatokat. Győződjön meg róla, hogy jó minőségű adatokat gyűjt a “4 adatgyűjtési technika” című blogunkkal: Which One’s Right for You?”.
Kvantitatív adatok elemzése
Adatelőkészítés
Az adatok elemzésének első szakasza az adatelőkészítés, amelynek célja a nyers adatok értelmes és olvashatóvá alakítása. Ez négy lépést foglal magában:
1. lépés: Az adatok validálása
Az adatok validálásának célja, hogy a lehető legnagyobb mértékben kiderüljön, hogy az adatgyűjtés az előre meghatározott szabványoknak megfelelően és minden torzítás nélkül történt-e. Ez egy négylépcsős folyamat, amely magában foglalja…
- Csalás, annak megállapítása, hogy az egyes válaszadókkal valóban interjút készítettek-e vagy sem.
- Szűrés, annak biztosítása, hogy a válaszadókat a kutatási kritériumoknak megfelelően választották ki.
- Eljárás, annak ellenőrzése, hogy az adatgyűjtési eljárást megfelelően követték-e.
- Teljesség, annak biztosítása, hogy a kérdezőbiztos az összes kérdést feltette a válaszadónak, és nem csak néhány szükségeset.
Ezért a kutatóknak véletlenszerű mintát kellene venniük a kitöltött felmérésekből, és validálniuk kellene az összegyűjtött adatokat. (Vegye figyelembe, hogy ez időigényes lehet a sok választ tartalmazó felmérések esetében.) Képzeljünk el például egy 200 válaszadóval végzett felmérést, amely 2 városra oszlik. A kutató mindkét városból 20 véletlenszerű válaszadóból álló mintát választhat. Ezt követően a kutató elérheti őket e-mailben vagy telefonon, és ellenőrizheti a válaszukat egy bizonyos kérdéssorozatra.
Nézzen meg 18 adatérvényesítést, amelyekkel eleve megakadályozhatja, hogy rossz adatok kerüljenek az adathalmazába.
2. lépés: Adatszerkesztés
A nagy adathalmazok jellemzően tartalmaznak hibákat. Például előfordulhat, hogy a válaszadók hibásan töltik ki a mezőket, vagy véletlenül kihagyják azokat. Annak érdekében, hogy megbizonyosodjon arról, hogy nincsenek ilyen hibák, a kutatónak alapvető adatellenőrzéseket kell végeznie, ellenőriznie kell a kiugró értékeket, és szerkesztenie kell a nyers kutatási adatokat, hogy azonosítsa és törölje azokat az adatpontokat, amelyek akadályozhatják az eredmények pontosságát.
Hiba lehet például az olyan mezők, amelyeket a válaszadók üresen hagytak. Az adatok szerkesztése során fontos meggyőződni arról, hogy az összes üres mezőt eltávolítja vagy kitölti. (Itt van 4 módszer a hiányzó adatok kezelésére.)
3. lépés: Adatkódolás
Ez az adatelőkészítés egyik legfontosabb lépése. A felmérésből származó válaszok csoportosítására és értékek hozzárendelésére utal.
Ha például egy kutató 1000 embert kérdezett meg, és most meg akarja találni a válaszadók átlagos életkorát, a kutató életkori vödröket hoz létre, és az egyes válaszadók életkorát e kódok szerint kategorizálja. (Például a 13-15 év közötti válaszadók életkorát 0-nak, a 16-18 év közöttieket 1-nek, a 18-20 év közöttieket 2-nek stb. kódolná)
Az elemzés során a kutató így egyszerűsített életkori sávokkal tud foglalkozni, nem pedig az egyéni életkorok hatalmas skálájával.
Kvantitatív adatelemzési módszerek
Ezek után az adatok készen állnak az elemzésre. A két leggyakrabban használt kvantitatív adatelemzési módszer a leíró statisztika és a következtetési statisztika.
Leíró statisztika
A leíró statisztika (más néven leíró elemzés) az elemzés első szintje. Segít a kutatóknak az adatok összegzésében és a minták megtalálásában. Néhány gyakran használt leíró statisztika:
- Átlag: egy értékkészlet számszerű átlaga.
- Medián: egy számszerű értékkészlet középértéke.
- Módusz: egy értékkészlet leggyakoribb értéke.
- Százalék: annak kifejezésére szolgál, hogy az adatokon belül egy érték vagy a válaszadók egy csoportja hogyan viszonyul a válaszadók egy nagyobb csoportjához.
- Gyakoriság: egy érték előfordulásának száma.
- Tartomány: a legmagasabb és a legalacsonyabb érték egy értékhalmazban.
A leíró statisztikák abszolút számokat szolgáltatnak. Nem magyarázzák azonban az e számok mögött meghúzódó indoklást vagy érvelést. A leíró statisztikák alkalmazása előtt fontos átgondolni, hogy melyik felel meg legjobban a kutatási kérdésének és annak, hogy mit szeretne megmutatni. A százalékos arány például jó módszer a válaszadók nemek szerinti megoszlásának bemutatására.
A leíró statisztika akkor a leghasznosabb, ha a kutatás a mintára korlátozódik, és nem kell nagyobb populációra általánosítani. Ha például két különböző faluban összehasonlítjuk az oltott gyermekek százalékos arányát, akkor elegendő a leíró statisztika.
Mivel a leíró elemzést többnyire egyetlen változó elemzésére használják, gyakran nevezik egyváltozós elemzésnek.
Minőségi adatok elemzése
A minőségi adatok elemzése kicsit másképp működik, mint a mennyiségi adatoké, elsősorban azért, mert a minőségi adatokat szavak, megfigyelések, képek, sőt szimbólumok alkotják. Az ilyen adatokból abszolút jelentést levezetni szinte lehetetlen, ezért leginkább feltáró kutatásokra használják. Míg a kvantitatív kutatásban egyértelmű különbség van az adatelőkészítés és az adatelemzés szakasza között, addig a kvalitatív kutatás esetében az elemzés gyakran már az adatok rendelkezésre állása után megkezdődik.
Adatelőkészítés és alapvető adatelemzés
Az elemzés és az előkészítés párhuzamosan történik, és a következő lépéseket tartalmazza:
- Az adatok megismerése: Mivel a legtöbb kvalitatív adat csak szavakból áll, a kutatónak azzal kell kezdenie, hogy többször elolvassa az adatokat, hogy megismerkedjen velük, és elkezdje keresni az alapvető megfigyeléseket vagy mintákat. Ez magában foglalja az adatok átírását is.
- A kutatási célok felülvizsgálata: Itt a kutató felülvizsgálja a kutatási célt, és meghatározza azokat a kérdéseket, amelyekre az összegyűjtött adatok segítségével választ kaphat.
- Keretrendszer kidolgozása: Más néven kódolás vagy indexelés, itt a kutató átfogó ötleteket, fogalmakat, viselkedéseket vagy kifejezéseket azonosít, és kódokat rendel hozzájuk. Például az életkor, a nem, a társadalmi-gazdasági státusz, sőt olyan fogalmak kódolása, mint a kérdésre adott pozitív vagy negatív válasz. A kódolás segít az adatok strukturálásában és címkézésében.
- Minták és kapcsolatok azonosítása: Miután az adatokat kódolták, a kutatás megkezdheti a témák azonosítását, a kérdésekre adott leggyakoribb válaszok keresését, a kutatási kérdésekre választ adó adatok vagy minták azonosítását, valamint a tovább vizsgálható területek megtalálását.
Kvalitatív adatelemzési módszerek
A kvalitatív adatok elemzésére több módszer is rendelkezésre áll. A leggyakrabban alkalmazott adatelemzési módszerek a következők:
- Tartalomelemzés: Ez az egyik leggyakoribb módszer a kvalitatív adatok elemzésére. Szövegek, médiumok vagy akár fizikai tárgyak formájában dokumentált információk elemzésére használják. Hogy mikor használjuk ezt a módszert, az a kutatási kérdésektől függ. A tartalomelemzést általában az interjúalanyoktól kapott válaszok elemzésére használják.
- Narratív elemzés: Ezt a módszert különböző forrásokból, például a válaszadók interjúiból, helyszíni megfigyelésekből vagy felmérésekből származó tartalmak elemzésére használják. Arra összpontosít, hogy az emberek által megosztott történeteket és tapasztalatokat használja fel a kutatási kérdések megválaszolásához.
- Diskurzuselemzés: A narratív elemzéshez hasonlóan a diskurzuselemzést is az emberekkel való interakciók elemzésére használják. Azonban annak a társadalmi kontextusnak az elemzésére összpontosít, amelyben a kutató és a válaszadó közötti kommunikáció zajlott. A diskurzuselemzés a válaszadó mindennapi környezetét is vizsgálja, és ezt az információt használja fel az elemzés során.
- Grounded theory: Ez arra utal, hogy a kvalitatív adatokat arra használják, hogy megmagyarázzák, miért történt egy bizonyos jelenség. Ezt úgy teszi, hogy számos hasonló esetet tanulmányoz különböző környezetben, és az adatokat felhasználja az ok-okozati magyarázatok levezetésére. A kutatók az újabb esetek tanulmányozása során módosíthatják a magyarázatokat, vagy újakat hozhatnak létre, amíg el nem jutnak egy olyan magyarázathoz, amely minden esetre illik.
Ezek a módszerek a leggyakrabban használtak. Azonban más adatelemzési módszerek, például a beszélgetéselemzés is rendelkezésre állnak.
Az adatelemzés talán a kutatás legfontosabb eleme. A gyenge elemzés pontatlan eredményeket produkál, amelyek nemcsak a kutatás hitelességét rontják, hanem a megállapításokat is használhatatlanná teszik. Az adatelemzési módszereket feltétlenül körültekintően kell megválasztani annak érdekében, hogy az eredmények tanulságosak és hasznosíthatók legyenek.
Header photo by Brittany Colette on Unsplash