Mărimea pantofilor și lungimea penisului
Mărimea pantofilor prezice lungimea penisului? Nu glumesc, acesta este un studiu real.
Pasul 1: Enunțați ipoteza nulă: Nu există o relație între mărimea pantofilor și lungimea penisului SAU Mărimea pantofilor nu prezice lungimea penisului. Scopul studiului ar fi să respingă această ipoteză, ceea ce ar favoriza ipoteza alternativă; adică Există o relație între mărimea pantofilor și lungimea penisului SAU mărimea pantofilor prezice lungimea penisului (există trei posibilități ; nicio corelație, o corelație pozitivă sau o corelație negativă)
Etapa 2: Doi urologi au măsurat lungimea întinsă a penisului a 104 bărbați într-un studiu prospectiv și au corelat-o cu mărimea pantofilor.
Etapa 3: Rezultatele au fost evaluate statistic cu ajutorul unui model de regresie prin metoda celor mai mici pătrate, cu un nivel de semnificație ales ca fiind P<0,05.
Valoare P
Acum să spunem că ați obținut un rezultat pozitiv, adică lungimea penisului crește odată cu mărimea pantofilor. Cum puteți fi siguri că această corelație a fost semnificativă din punct de vedere statistic sau, cu alte cuvinte, cât de bine susțin datele eșantionului argumentul că ipoteza nulă este adevărată ? Aici intervine valoarea p. Valoarea p ajustează pentru incertitudine, spunându-vă cât de probabil este efectul observat în datele dvs. dacă ipoteza nulă ar fi adevărată.
Iată definiția Asociației Americane de Statistică (ASA):
Valoarea p este probabilitatea, în cadrul unui model statistic specificat, ca un rezumat statistic al datelor (de exemplu, diferența mediei eșantionului între două grupuri comparate) să fie egală sau mai extremă decât valoarea sa observată
Dacă ați stabilit semnificația statistică la 0.05, atunci o valoare p de <0,05 vă spune că, presupunând că ipoteza nulă este adevărată, există o probabilitate foarte mică de a obține un rezultat care este egal sau mai extrem decât rezultatul observat. ( 1 din 20 sau 5% probabilitate). Prin urmare, există dovezi pentru a respinge ipoteza nulă.
Pe de altă parte, dacă valoarea p era <0,65, atunci, presupunând că ipoteza nulă este adevărată, v-ați aștepta să obțineți rezultatul observat sau mai extrem 65% din timp. Nu este prea flash, nu-i așa? Ipoteza nulă ar rămâne atunci adevărată. Sper că asta vă ajută să înțelegeți valoarea P.
Bine, pentru cei curioși, rezultatele reale au fost următoarele:
Statistica de regresie liniară între lungimea penisului întins și mărimea pantofilor a dat un r2 de 0,012 (P=0,28), sugerând că nu există o relație semnificativă statistic între lungimea penisului întins și mărimea pantofilor.
Interpretarea valorii p este:
Să presupunem că ipoteza nulă este adevărată (mărimea pantofilor nu prezice lungimea penisului), efectul observat sau mai mult ar avea loc în 28% din timp.
INTERVALURI DE CONFIDENȚĂ
Un alt concept în precizie este Intervalul de încredere (IC). În studiul de mai sus, nu există nicio posibilitate de a lua un eșantion din toți bărbații din lume și de a le măsura mărimea pantofilor sau lungimea penisului.
Dacă s-ar putea, s-ar obține coeficientul exact de corelație sau mărimile medii pentru mărimea pantofilor și, de asemenea, pentru lungimea penisului. Prin urmare, este necesar să se ofere un anumit interval între care se află adevărata măsură. Acesta este intervalul de încredere.
De obicei, intervalul de încredere este stabilit la 95%, ceea ce vă spune că, dacă ați face acest studiu de 100 de ori, de 95 din 100 de ori, adevărata măsură s-ar afla între cele două intervale de încredere.
Să ne uităm la un alt studiu interesant.
FOTBALUL ȘI ATACURILE DE INIMĂ
Să ne uităm la un alt exemplu și să încercăm să răspundem la următoarele întrebări. Citiți următorul rezultat al studiului realizat de Wilbert-Lampen et al. Studiul examinează asocierea dintre evenimentele cardiovasculare și Cupa Mondială de fotbal.
Evenimentele cardiovasculare ( a se citi = probleme cardiace) apărute la pacienții din zona metropolitană a orașului München au fost evaluate prospectiv de către medicii de urgență în timpul Cupei Mondiale. Am comparat aceste evenimente cu evenimentele care au avut loc în timpul perioadei de control: de la 1 mai la 8 iunie și de la 10 la 31 iulie 2006 și de la 1 mai la 31 iulie în 2003 și 2005.
Evenimentele cardiovasculare acute au fost evaluate la 4279 de pacienți. În zilele de meciuri în care a fost implicată echipa Germaniei, incidența urgențelor cardiace a fost de 2,66 ori mai mare decât cea din perioada de control (interval de încredere de 95% , 2,33 până la 3,04; P<0,001); pentru bărbați, incidența a fost de 3.26 de ori mai mare decât în timpul perioadei de control (intervalul de încredere de 95%, 2,78 – 3,84; P<0,001), iar pentru femei, a fost de 1,82 de ori mai mare decât în timpul perioadei de control (interval de încredere de 95%, 1,44 – 2,31; P<0,001).1. Incidența urgențelor cardiace a fost semnificativă din punct de vedere statistic și de ce?
2. Au bărbații un risc crescut de evenimente cardiovasculare în timpul meciurilor de la Cupa Mondială? Este acesta mai mare decât riscul pentru femei? Este rezultatul semnificativ din punct de vedere statistic?
3. În cele din urmă, ar trebui să se aplice proceduri de urgență mai mari în timpul evenimentelor de la Cupa Mondială pe baza acestui rezultat? (Sugestie: Acest lucru necesită o gândire subiectivă și analitică și depinde de multe variabile). Răspunsurile la final.PUNCTE CHEIE DE REȚINUT
Valoarea p în sine nu înseamnă nimic. Ea trebuie să fie pusă în contextul metodologiei studiului și al măsurii efectului. Valorile P pot deveni semnificative prin reducerea robusteții măsurii ( de exemplu, dacă îmbunătățirea indicatorului de referință este de 8 puncte și obțineți un rezultat nesemnificativ, prin reducerea indicatorului la 4 puncte, puteți obține un rezultat semnificativ din punct de vedere statistic).
Dar o îmbunătățire de 4 puncte nu este la fel de bună ca o îmbunătățire de 8 puncte. Interpretarea este întotdeauna subiectivă, iar aici sunt importante abilitățile analitice. Aceasta vă asigură că nu luați lucrurile la valoarea nominală.
Potrivit articolului frapant al lui Ioannidis, Why Most Published Research Findings Are False:
Research is not most appropriately represented and summarized by p-values, but, unfortunately, there is a widespread notion that medical research articles should be interpreted based only on p-values.
Potrivit declarației publicate recent de ASA-
Valoarea p nu a fost niciodată menită să înlocuiască raționamentul științific.
De-a lungul timpului se pare că valoarea p a devenit un gardian pentru a stabili dacă o lucrare este publicabilă, cel puțin în anumite domenii,…… Această aparentă prejudecată editorială duce la „efectul de sertar de dosare”, în care cercetările cu rezultate semnificative din punct de vedere statistic au mult mai multe șanse de a fi publicate, în timp ce alte lucrări care ar putea fi la fel de importante din punct de vedere științific nu sunt niciodată văzute pe hârtie. De asemenea, conduce la practici denumite sub nume precum ‘p-hacking’ și ‘data dredging’, care pun accentul pe căutarea unor valori p mici în detrimentul altor raționamente statistice și științifice.
O valoare p, sau semnificația statistică, nu măsoară mărimea unui efect sau importanța unui rezultat.
Valoarea p nu măsoară probabilitatea ca ipoteza studiată să fie adevărată, sau probabilitatea ca datele să fi fost produse doar de întâmplare.
Concluziile științifice și deciziile de afaceri sau de politică nu ar trebui să se bazeze doar pe faptul că o valoare p depășește un anumit prag.
CI este intervalul de valori între care se află adevărata măsură a populației pentru un anumit nivel de încredere.
Intervalurile de încredere pot fi îngustate prin creșterea dimensiunii eșantionului, deoarece începeți să vă apropiați de adevărata măsură a populației prin includerea mai multor persoane din populație.
RĂSPUNSURI
1. Da, incidența a fost semnificativă din punct de vedere statistic, după cum subliniază valoarea p.
2. Bărbații au un risc mai mare de evenimente cardiovasculare decât femeile, iar riscul este semnificativ din punct de vedere statistic. Priviți IC și valorile P.
3. Nu există răspunsuri fixe și sunt necesare alte studii. Persoane diferite pot avea moduri diferite de a analiza aceste date..