Twój przewodnik po wartościach P i przedziałach ufności – rozmiar buta, długość prącia, piłka nożna i ataki serca!

author
6 minutes, 27 seconds Read
Rozmiar buta a długość prącia

Czy rozmiar buta przewiduje długość prącia? Nie żartuję, to jest prawdziwe badanie.

Krok 1: Postaw hipotezę zerową: Nie ma związku między rozmiarem buta a długością prącia LUB Rozmiar buta nie przewiduje długości prącia. Celem badania byłoby odrzucenie tej hipotezy, która następnie sprzyjałaby hipotezie alternatywnej; tj. istnieje związek pomiędzy rozmiarem buta a długością prącia LUB rozmiar buta przewiduje długość prącia (istnieją trzy możliwości; brak korelacji, korelacja pozytywna lub korelacja negatywna)

Krok 2: Dwóch urologów zmierzyło rozciągniętą długość prącia 104 mężczyzn w badaniu prospektywnym i powiązało to z ich rozmiarem buta.

Krok 3: Wyniki zostały ocenione statystycznie przy użyciu modelu regresji najmniejszych kwadratów, z poziomem istotności wybranym jako P<0,05.

Wartość P

Teraz powiedzmy, że otrzymałeś pozytywny wynik, tzn. długość prącia wzrasta wraz z rozmiarem buta. Jak możesz być pewien, że ta korelacja była statystycznie istotna lub innymi słowy, jak dobrze dane z próby wspierają argument, że hipoteza zerowa jest prawdziwa? W tym miejscu pojawia się wartość p. Wartość p dostosowuje się do niepewności, mówiąc jak prawdopodobny jest efekt zaobserwowany w danych, jeśli hipoteza zerowa byłaby prawdziwa.

Tutaj jest definicja Amerykańskiego Stowarzyszenia Statystycznego (ASA):

p-value to prawdopodobieństwo w ramach określonego modelu statystycznego, że statystyczne podsumowanie danych (na przykład średnia z próby różnica między dwiema porównywanymi grupami) byłoby równe lub bardziej ekstremalne niż jego obserwowana wartość

Jeśli ustaliłeś istotność statystyczną na poziomie 0.05, to wartość p równa <0,05 mówi Ci, że przy założeniu prawdziwości hipotezy zerowej istnieje bardzo małe prawdopodobieństwo uzyskania wyniku równego lub bardziej skrajnego niż wynik obserwowany. ( 1 na 20 lub 5% prawdopodobieństwa). Thus, there is evidence to reject the null hypothesis.

On the other hand if the p value was <0.65 then assuming the null hypothesis is true, you would expect to obtain the observed result or more extreme 65% of the time. Thats no too flash is it? Hipoteza zerowa pozostałaby wtedy prawdziwa. I hope that helps you understand the P value.

Well for those that are curious, the real results were the following:

The linear regression statistic between the stretched penile length and shoe size gave an r2 of 0.012 (P=0.28), suggesting no statistically significant relationship between stretched penile length and shoe size.

Interpretacja wartości p jest następująca:

Zakładając, że hipoteza zerowa jest prawdziwa (rozmiar buta nie przewiduje długości prącia), obserwowany efekt lub więcej wystąpiłby 28% czasu.

ODSTĘPY ZAUFANIA

Innym pojęciem w precyzji są przedziały ufności (CI). W powyższym badaniu, nie ma możliwości pobrania próbki wszystkich mężczyzn na świecie i zmierzenia ich rozmiarów butów lub długości prącia.

Gdyby można było, otrzymalibyśmy dokładny współczynnik korelacji lub średnie wielkości dla rozmiaru buta, a także dla długości prącia. Dlatego istnieje potrzeba zapewnienia pewnego zakresu, pomiędzy którym leży prawdziwa miara. To jest przedział ufności.

Zwykle przedział ufności jest ustalony na 95%, co mówi, że gdybyś przeprowadził to badanie 100 razy, 95 na 100 razy, prawdziwa miara leżałaby pomiędzy dwoma przedziałami ufności.

Przyjrzyjrzyjmy się innemu ciekawemu badaniu.

PIŁKA NOŻNA I ZAWAŁ SERCA

Przyjrzyjrzyjmy się innemu przykładowi i spróbujmy odpowiedzieć na następujące pytania. Przeczytaj następujący wynik badania w badaniu Wilbert-Lampen i wsp. Badanie bada związek między zdarzeniami sercowo-naczyniowymi a Mistrzostwami Świata w piłce nożnej.

Zdarzenia sercowo-naczyniowe (czytaj = problemy z sercem) występujące u pacjentów w większym obszarze Monachium były prospektywnie oceniane przez lekarzy pogotowia ratunkowego podczas Mistrzostw Świata w piłce nożnej. Porównaliśmy te zdarzenia ze zdarzeniami, które wystąpiły w okresie kontrolnym: 1 maja do 8 czerwca i 10 lipca do 31 lipca 2006 r., A także 1 maja do 31 lipca w 2003 i 2005 r.
Ostre zdarzenia sercowo-naczyniowe oceniono u 4279 pacjentów. W dniach meczów z udziałem niemieckiej drużyny, częstość występowania nagłych zdarzeń sercowych była 2,66 razy większa niż w okresie kontrolnym (95% przedział ufności , 2,33 do 3,04; P<0,001); dla mężczyzn, częstość występowania była 3.26 razy większa niż w okresie kontrolnym (95% CI, 2,78 do 3,84; P<0,001), a dla kobiet była 1,82 razy większa niż w okresie kontrolnym (95% CI, 1,44 do 2,31; P<0,001).

1. Czy częstość występowania nagłych zdarzeń sercowych była istotna statystycznie i dlaczego?
2. Czy mężczyźni mają zwiększone ryzyko zdarzeń sercowo-naczyniowych podczas meczów mistrzostw świata? Czy ryzyko to jest większe niż u kobiet? Czy wynik jest statystycznie istotny?
3. Wreszcie, czy na podstawie tego wyniku należy wprowadzić więcej procedur awaryjnych podczas imprez Pucharu Świata? (Wskazówka: Wymaga to subiektywnego i analitycznego myślenia i zależy od wielu zmiennych). Odpowiedzi na końcu.

KEY TAKEAWAY POINTS

Wartość p sama w sobie nic nie znaczy. Należy ją umieścić w kontekście metodologii badania i miary efektu. Wartości P można uczynić znaczącymi poprzez zmniejszenie solidności środka (np. jeśli poprawa benchmarku wynosi 8 punktów i otrzymujemy nieistotny wynik, poprzez zmniejszenie benchmarku do 4 punktów możemy otrzymać wynik istotny statystycznie).

Ale poprawa o 4 punkty nie jest tak dobra jak poprawa o 8 punktów. Interpretacja jest zawsze subiektywna, i to jest to, gdzie umiejętności analityczne są ważne. Zapewnia, że nie bierzesz rzeczy na wartość nominalną.

Zgodnie z uderzającym artykułem Ioannidisa, Why Most Published Research Findings Are False:

Badania nie są najwłaściwiej reprezentowane i podsumowywane przez p-wartości, ale, niestety, istnieje powszechne przekonanie, że artykuły z badań medycznych powinny być interpretowane w oparciu tylko o p-wartości.

Zgodnie z niedawno wydanym oświadczeniem ASA-

Wartość p nigdy nie miała być substytutem rozumowania naukowego.

Z czasem wydaje się, że wartość p stała się strażnikiem tego, czy praca nadaje się do publikacji, przynajmniej w niektórych dziedzinach,….. Ta oczywista redakcyjna stronniczość prowadzi do „efektu szuflady na akta”, w którym badania o statystycznie istotnych wynikach mają większe szanse na publikację, podczas gdy inne prace, które mogą być równie ważne z naukowego punktu widzenia, nigdy nie ukazują się drukiem. Prowadzi to również do praktyk określanych takimi nazwami jak „p-hacking” i „data dredging”, które kładą nacisk na poszukiwanie małych p-wartości ponad inne statystyczne i naukowe rozumowanie.

Wartość p, lub istotność statystyczna, nie mierzy wielkości efektu lub ważności wyniku.

Wartości p nie mierzą prawdopodobieństwa, że badana hipoteza jest prawdziwa, lub prawdopodobieństwa, że dane zostały wyprodukowane przez sam przypadek.

Wnioski naukowe i decyzje biznesowe lub polityczne nie powinny być oparte tylko na tym, czy wartość p przekracza określony próg.

CI to zakres wartości, pomiędzy którymi leży prawdziwa miara populacji dla danego poziomu ufności.

Przedziały ufności mogą być zawężone przez zwiększenie wielkości próby, ponieważ zaczynasz zbliżać się do prawdziwej miary populacji przez włączenie większej liczby osób z populacji.

ODPOWIEDZI

1. Tak, częstość występowania była istotna statystycznie, jak nakreślono przez wartość p.
2. Mężczyźni mają większe ryzyko zdarzeń sercowo-naczyniowych niż kobiety, a ryzyko jest istotne statystycznie. Spójrz na wartości CI i P.
3. Nie ma stałych odpowiedzi i wymagane są inne badania. Różni ludzie mogą mieć różne sposoby analizowania tych danych.

.

Similar Posts

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.