Jaka jest pierwsza rzecz, która przychodzi nam na myśl, gdy widzimy dane? Pierwszym odruchem jest znalezienie wzorców, połączeń i związków. Patrzymy na dane, aby znaleźć w nich znaczenie.
Podobnie w badaniach, po zebraniu danych, kolejnym krokiem jest uzyskanie z nich wglądu. Na przykład, jeśli marka odzieżowa próbuje zidentyfikować najnowsze trendy wśród młodych kobiet, najpierw dotrze do młodych kobiet i zada im pytania związane z celem badania. Po zebraniu tych informacji marka przeanalizuje te dane w celu zidentyfikowania wzorców – na przykład może odkryć, że większość młodych kobiet chciałaby zobaczyć więcej różnorodnych dżinsów.
Analiza danych to sposób, w jaki badacze przechodzą od masy danych do znaczących spostrzeżeń. Istnieje wiele różnych metod analizy danych, w zależności od rodzaju badań. Oto kilka metod, których możesz użyć do analizy danych ilościowych i jakościowych.
Ciężko jest analizować złe dane. Upewnij się, że zbierasz dane wysokiej jakości, korzystając z naszego bloga „4 Techniki zbierania danych: Which One’s Right for You?”.
Analiza danych ilościowych
Przygotowanie danych
Pierwszym etapem analizy danych jest przygotowanie danych, którego celem jest przekształcenie surowych danych w coś znaczącego i czytelnego. Obejmuje on cztery kroki:
Krok 1: Walidacja danych
Celem walidacji danych jest ustalenie, na ile to możliwe, czy zbieranie danych odbyło się zgodnie z ustalonymi standardami i bez jakiejkolwiek stronniczości. Jest to czteroetapowy proces, który obejmuje…
- Oszustwo, aby wywnioskować, czy z każdym respondentem rzeczywiście przeprowadzono wywiad, czy też nie.
- Screening, aby upewnić się, że respondenci zostali wybrani zgodnie z kryteriami badawczymi.
- Procedura, aby sprawdzić, czy procedura zbierania danych była należycie przestrzegana.
- Kompletność, aby upewnić się, że ankieter zadał respondentowi wszystkie pytania, a nie tylko kilka wymaganych.
Aby to zrobić, badacze musieliby wybrać losową próbę wypełnionych ankiet i zatwierdzić zebrane dane. (Zauważ, że może to być czasochłonne w przypadku ankiet z dużą liczbą odpowiedzi.) Na przykład, wyobraź sobie ankietę z 200 respondentami podzieloną na 2 miasta. Badacz może wybrać próbę 20 losowych respondentów z każdego miasta. Następnie, badacz może skontaktować się z nimi poprzez email lub telefon i sprawdzić ich odpowiedzi na określony zestaw pytań.
Sprawdź 18 walidacji danych, które zapobiegną przedostawaniu się złych danych do Twojego zestawu danych.
Krok 2: Edycja danych
Typowo, duże zestawy danych zawierają błędy. Na przykład, respondenci mogą nieprawidłowo wypełnić pola lub przypadkowo je pominąć. Aby upewnić się, że nie ma takich błędów, badacz powinien przeprowadzić podstawowe kontrole danych, sprawdzić, czy nie ma wartości odstających i edytować surowe dane badawcze, aby zidentyfikować i usunąć wszelkie punkty danych, które mogą utrudnić dokładność wyników.
Na przykład, błędem mogą być pola, które zostały pozostawione puste przez respondentów. Podczas edycji danych, ważne jest, aby upewnić się, że usunięto lub wypełniono wszystkie puste pola. (Tutaj są 4 metody radzenia sobie z brakującymi danymi.)
Krok 3: Kodowanie danych
Jest to jeden z najważniejszych kroków w przygotowaniu danych. Odnosi się do grupowania i przypisywania wartości do odpowiedzi z ankiety.
Na przykład, jeśli badacz przeprowadził wywiady z 1000 osób i teraz chce znaleźć średni wiek respondentów, badacz stworzy przedziały wiekowe i skategoryzuje wiek każdego z respondentów zgodnie z tymi kodami. (Na przykład, respondenci w wieku 13-15 lat będą mieli zakodowany wiek jako 0, 16-18 jako 1, 18-20 jako 2, itd.)
Wtedy podczas analizy, badacz może mieć do czynienia z uproszczonymi przedziałami wiekowymi, a nie z ogromnym zakresem indywidualnego wieku.
Metody analizy danych ilościowych
Po tych krokach, dane są gotowe do analizy. Dwa najczęściej używane metody analizy danych ilościowych są statystyki opisowe i inferential statistics.
Statystyki opisowe
Typowo statystyki opisowe (znany również jako analiza opisowa) jest pierwszy poziom analizy. To pomaga badaczom podsumować dane i znaleźć wzorce. Kilka powszechnie stosowanych statystyk opisowych to:
- Średnia: średnia liczbowa zestawu wartości.
- Mediana: punkt środkowy zestawu wartości liczbowych.
- Tryb: najczęściej występująca wartość wśród zestawu wartości.
- Procent: używany do wyrażenia, jak wartość lub grupa respondentów w ramach danych odnosi się do większej grupy respondentów.
- Częstotliwość: liczba przypadków, w których dana wartość występuje.
- Zakres: najwyższa i najniższa wartość w zbiorze wartości.
Statystyki opisowe dostarczają liczb bezwzględnych. Nie wyjaśniają one jednak przesłanek ani rozumowania stojącego za tymi liczbami. Przed zastosowaniem statystyk opisowych, ważne jest, aby zastanowić się, która z nich najlepiej pasuje do pytania badawczego i tego, co chcesz pokazać. Na przykład, procent jest dobrym sposobem na pokazanie rozkładu płci respondentów.
Statystyki opisowe są najbardziej pomocne, gdy badania są ograniczone do próby i nie muszą być uogólniane na większą populację. Na przykład, jeśli porównujesz odsetek dzieci zaszczepionych w dwóch różnych wioskach, wtedy statystyka opisowa jest wystarczająca.
Ponieważ analiza opisowa jest najczęściej używana do analizy pojedynczej zmiennej, jest często nazywana analizą jednoczynnikową.
Analiza danych jakościowych
Analiza danych jakościowych działa nieco inaczej niż danych ilościowych, przede wszystkim dlatego, że dane jakościowe składają się ze słów, obserwacji, obrazów, a nawet symboli. Wyodrębnienie absolutnego znaczenia z takich danych jest prawie niemożliwe, dlatego też są one najczęściej wykorzystywane do badań eksploracyjnych. Podczas gdy w badaniach ilościowych istnieje wyraźne rozróżnienie między etapem przygotowania i analizy danych, analiza w badaniach jakościowych często rozpoczyna się zaraz po udostępnieniu danych.
Przygotowanie danych i podstawowa analiza danych
Analiza i przygotowanie przebiegają równolegle i obejmują następujące kroki:
- Zapoznanie się z danymi: Ponieważ większość danych jakościowych to tylko słowa, badacz powinien zacząć od kilkukrotnego przeczytania danych, aby się z nimi zapoznać i zacząć szukać podstawowych obserwacji lub wzorców. Obejmuje to również transkrypcję danych.
- Rewizja celów badawczych: Tutaj badacz powraca do celu badawczego i identyfikuje pytania, na które można odpowiedzieć dzięki zebranym danym.
- Opracowanie ram: Znane również jako kodowanie lub indeksowanie, tutaj badacz identyfikuje szerokie idee, koncepcje, zachowania lub frazy i przypisuje im kody. Na przykład, kodowanie wieku, płci, statusu społeczno-ekonomicznego, a nawet takich pojęć jak pozytywna lub negatywna odpowiedź na pytanie. Kodowanie jest pomocne w strukturyzacji i oznaczaniu danych.
- Identyfikacja wzorców i połączeń: Po zakodowaniu danych badania mogą rozpocząć identyfikację tematów, poszukiwanie najczęstszych odpowiedzi na pytania, identyfikację danych lub wzorców, które mogą odpowiedzieć na pytania badawcze, oraz znalezienie obszarów, które mogą być dalej eksplorowane.
Metody analizy danych jakościowych
Do analizy danych jakościowych dostępnych jest wiele metod. Do najczęściej stosowanych metod analizy danych należą:
- Analiza treści: Jest to jedna z najbardziej powszechnych metod analizy danych jakościowych. Jest ona stosowana do analizy udokumentowanych informacji w postaci tekstów, mediów, a nawet przedmiotów fizycznych. Kiedy używać tej metody zależy od pytań badawczych. Analiza treści jest zwykle używana do analizy odpowiedzi od respondentów.
- Analiza narracyjna: Metoda ta służy do analizy treści z różnych źródeł, takich jak wywiady z respondentami, obserwacje z terenu, czy ankiety. Skupia się ona na wykorzystaniu historii i doświadczeń dzielonych przez ludzi do odpowiedzi na pytania badawcze.
- Analiza dyskursu: Podobnie jak analiza narracyjna, analiza dyskursu jest wykorzystywana do analizy interakcji z ludźmi. Skupia się ona jednak na analizie kontekstu społecznego, w którym doszło do komunikacji między badaczem a respondentem. Analiza dyskursu przygląda się również codziennemu otoczeniu respondenta i wykorzystuje te informacje podczas analizy.
- Teoria ugruntowana: Odnosi się do wykorzystania danych jakościowych w celu wyjaśnienia, dlaczego doszło do pewnego zjawiska. W tym celu bada się wiele podobnych przypadków w różnych środowiskach i wykorzystuje dane do uzyskania wyjaśnień przyczynowych. Naukowcy mogą zmieniać wyjaśnienia lub tworzyć nowe w miarę badania kolejnych przypadków, aż dojdą do wyjaśnienia, które pasuje do wszystkich przypadków.
Te metody są najczęściej stosowane. Jednak inne metody analizy danych, takie jak analiza konwersacyjna, są również dostępne.
Analiza danych jest prawdopodobnie najważniejszym składnikiem badań. Słaba analiza produkuje niedokładne wyniki, które nie tylko utrudniają autentyczność badań, ale także sprawiają, że wyniki są bezużyteczne. Konieczne jest, aby starannie wybrać metody analizy danych, aby zapewnić, że wyniki są wnikliwe i nadają się do działania.
Header photo by Brittany Colette on Unsplash