Din guide till P-värden och konfidensintervall – skostorlek, penislängd, fotboll och hjärtinfarkt

author
6 minutes, 27 seconds Read
SKOSTORLEK OCH PENILLÄNGDEN

Gör skostorlek en förutsägelse av penislängd? Jag skojar inte, det här är en riktig studie.

Steg 1: Ange nollhypotesen: Det finns inget samband mellan skostorlek och penislängd ELLER Skostorlek förutsäger inte penislängd. Syftet med studien skulle vara att förkasta denna hypotes, vilket skulle gynna den alternativa hypotesen, dvs. att det finns ett samband mellan skostorlek och penislängd ELLER att skostorlek förutsäger penislängd (det finns tre möjligheter: ingen korrelation, positiv eller negativ korrelation)

Steg 2: Två urologer mätte den utsträckta penislängden hos 104 män i en prospektiv studie och satte detta i relation till deras skostorlek.

Steg 3: Resultaten bedömdes statistiskt med hjälp av en minsta kvadraters regressionsmodell, där signifikansnivån valdes till P<0,05.

P-värde

Säg nu att du fick ett positivt resultat, det vill säga att penislängden ökar med skostorleken. Hur kan du vara säker på att denna korrelation var statistiskt signifikant eller med andra ord hur väl stödjer urvalsdata argumentet att nollhypotesen är sann? Det är här som p-värdet kommer in i bilden. P-värdet justerar för osäkerhet genom att tala om för dig hur troligt det är att den effekt som observerats i dina data är om nollhypotesen är sann.

Här är Americal Statistical Associations (ASA) definition:

p-värde är sannolikheten enligt en specificerad statistisk modell att en statistisk sammanfattning av data (till exempel skillnaden i stickprovsmedelvärde mellan två jämförda grupper) skulle vara lika med eller mer extrem än det observerade värdet

Om du har fastställt den statistiska signifikansen till 0.05, så säger ett p-värde på <0,05 att om man antar att nollhypotesen är sann, så är sannolikheten för att få ett resultat som är lika med eller mer extremt än det observerade resultatet mycket liten. ( 1 på 20 eller 5 % sannolikhet). Det finns alltså bevis för att förkasta nollhypotesen.

Å andra sidan, om p-värdet var <0,65 skulle man, om man antar att nollhypotesen är sann, förvänta sig att få det observerade resultatet eller ett mer extremt resultat i 65 % av fallen. Det är väl inte så flashigt, eller hur? Nollhypotesen skulle då förbli sann. Jag hoppas att det hjälper dig att förstå P-värdet.

För dem som är nyfikna var de verkliga resultaten följande:

Den linjära regressionsstatistiken mellan den utsträckta penislängden och skostorleken gav ett r2 på 0,012 (P=0,28), vilket tyder på att det inte finns något statistiskt signifikant samband mellan utsträckt penislängd och skostorlek.

Tolkningen av p-värdet är:

Antagen att nollhypotesen är sann (skostorlek förutsäger inte penislängd), skulle den observerade effekten eller mer inträffa 28 % av tiden.

KONFIDENSINTERVALLEN

Det andra begreppet inom precision är konfidensintervall (CI). I studien ovan finns det ingen möjlighet att ta ett urval av alla män i världen och mäta deras skostorlekar eller penislängder.

Om man kunde det skulle man få den exakta korrelationskoefficienten eller medelstorlekarna för skostorleken och även för penislängden. Därför finns det ett behov av att ange ett intervall mellan vilket det sanna måttet ligger. Detta är konfidensintervallet.

Svenska konfidensintervallet sätts till 95 %, vilket säger att om man gör den här studien 100 gånger, 95 av 100 gånger, skulle det sanna måttet ligga mellan de två konfidensintervallen.

Låt oss titta på en annan intressant studie.

FOTBOLL OCH HJÄRTANFLYKT

Låt oss titta på ett annat exempel och försöka besvara följande frågor. Läs följande studieresultat i studien av Wilbert-Lampen et al. I studien undersöks sambandet mellan kardiovaskulära händelser och fotbolls-VM.

Kardiovaskulära händelser ( läs = hjärtproblem) som inträffade hos patienter i storområdet München utvärderades prospektivt av akutläkare under fotbolls-VM. Vi jämförde dessa händelser med händelser som inträffade under kontrollperioden: 1 maj till 8 juni och 10 juli till 31 juli 2006 samt 1 maj till 31 juli 2003 och 2005.
Akuta kardiovaskulära händelser bedömdes hos 4279 patienter. Under de dagar då det tyska laget spelade matcher var förekomsten av hjärtattacker 2,66 gånger högre än under kontrollperioden (95 % konfidensintervall , 2,33 till 3,04; P<0,001); för män var förekomsten 3 gånger högre än under kontrollperioden.26 gånger den under kontrollperioden (95 % CI, 2,78 till 3,84; P<0,001), och för kvinnor var den 1,82 gånger den under kontrollperioden (95 % CI, 1,44 till 2,31; P<0,001).

1. Var förekomsten av kardiovaskulära nödsituationer statistiskt signifikant och varför?
2. Har män en ökad risk för kardiovaskulära händelser under VM-matcher? Är denna större än risken för kvinnor? Är resultatet statistiskt signifikant?
3. Slutligen, bör större akutprocedurer införas under VM-tävlingar på grundval av detta resultat? (Tips: Detta kräver subjektivt och analytiskt tänkande och beror på många variabler). Svaren finns i slutet.

VÄSENTLIGA VÄRDERINGSPUNKTER

P-värdet i sig självt betyder ingenting. Det måste sättas in i ett sammanhang med studiens metodik och effektmåttet. P-värden kan göras signifikanta genom att minska måttets robusthet (t.ex. om en förbättring av riktmärket är 8 poäng och du får ett icke-signifikant resultat, kan du genom att minska riktmärket till 4 poäng få ett statistiskt signifikant resultat).

Men en förbättring med 4 poäng är inte lika bra som en förbättring med 8 poäng. Tolkningen är alltid subjektiv, och det är här som analytiska färdigheter är viktiga. Det säkerställer att man inte tar saker och ting för vad de är på ytan.

Enligt Ioannidis slående artikel, Why Most Published Research Findings Are False:

Forskning representeras och sammanfattas inte lämpligast av p-värden, men tyvärr finns det en utbredd föreställning om att medicinska forskningsartiklar ska tolkas enbart utifrån p-värden.

Enligt det nyligen offentliggjorda uttalandet från ASA-

Det var aldrig meningen att p-värdet skulle ersätta vetenskapligt resonemang.

Med tiden verkar det som om p-värdet har blivit en grindvakt för om arbetet är publicerbart, åtminstone inom vissa områden,…… Denna uppenbara redaktionella bias leder till ”arkivskåpseffekten”, där forskning med statistiskt signifikanta resultat har mycket större sannolikhet att publiceras, medan annat arbete som mycket väl skulle kunna vara lika viktigt ur vetenskaplig synvinkel aldrig syns i tryckt form. Det leder också till metoder som kallas med namn som ”p-hacking” och ”data-dredging” och som betonar sökandet efter små p-värden framför andra statistiska och vetenskapliga resonemang.

Ett p-värde, eller statistisk signifikans, mäter inte storleken på en effekt eller betydelsen av ett resultat.

P-värden mäter inte sannolikheten för att den studerade hypotesen är sann eller sannolikheten för att data enbart har producerats av en slumpmässig slump.

Vetenskapliga slutsatser och affärs- eller politiska beslut bör inte baseras enbart på om ett p-värde passerar ett visst tröskelvärde.

CI är det värdeintervall mellan vilket det sanna befolkningsmåttet ligger för en given konfidensnivå.

Konfidensintervallerna kan minskas genom att öka urvalsstorleken, eftersom man börjar närma sig det sanna befolkningsmåttet genom att inkludera fler personer ur befolkningen.

SVAR

1. Ja, incidensen var statistiskt signifikant, vilket framgår av p-värdet.
2. Män har en större risk för kardiovaskulära händelser än kvinnor, och risken är statistiskt signifikant. Titta på KI- och P-värdena.
3. Det finns inga fasta svar, och det krävs andra studier. Olika personer kan ha olika sätt att analysera dessa data.

Similar Posts

Lämna ett svar

Din e-postadress kommer inte publiceras.