Din guide til P-værdier og konfidensintervaller – skostørrelse, penislængde, fodbold og hjerteanfald!

author
6 minutes, 22 seconds Read
SKOSTØRRELSE OG PENILLÆNGDE

Påskriver skostørrelse penislængde? Jeg laver ikke sjov, dette er en rigtig undersøgelse.

Stræk 1: Angiv nulhypotesen: Der er ingen sammenhæng mellem skostørrelse og penislængde ELLER Skostørrelse forudsiger ikke penislængde. Formålet med undersøgelsen ville være at forkaste denne hypotese, hvilket ville fremme den alternative hypotese, dvs. at der er en sammenhæng mellem skostørrelse og penislængde ELLER at skostørrelse forudsiger penislængde (der er tre muligheder: ingen sammenhæng, positiv eller negativ sammenhæng)

Stræk 2: To urologer målte den strakte penislængde hos 104 mænd i en prospektiv undersøgelse og satte den i relation til deres skostørrelse.

Stræk 3: Resultaterne blev vurderet statistisk ved hjælp af en mindste kvadraters regressionsmodel, hvor signifikansniveauet blev valgt som P<0,05.

P-værdi

Sæt nu, at du fik et positivt resultat, dvs. at penislængden øges med skostørrelsen. Hvordan kan du være sikker på, at denne sammenhæng var statistisk signifikant, eller med andre ord, hvor godt understøtter stikprøvedataene argumentet for, at nulhypotesen er sand ? Det er her, p-værdien kommer ind i billedet. P-værdien justerer for usikkerhed ved at fortælle dig, hvor sandsynligt det er, at den effekt, der er observeret i dine data, er, hvis nulhypotesen var sand.

Her er Americal Statistical Association (ASA)’s definition:

p-værdi er sandsynligheden under en specificeret statistisk model for, at et statistisk resumé af dataene (f.eks. stikprøvens gennemsnitlige forskel mellem to sammenlignede grupper) ville være lig med eller mere ekstrem end den observerede værdi

Hvis du har fastsat den statistiske signifikans til 0.05, så fortæller en p-værdi på <0,05 dig, at der, hvis nulhypotesen er sand, er en meget lille sandsynlighed for at opnå et resultat, der er lig med eller mere ekstremt end det observerede resultat. ( 1 ud af 20 eller 5 % sandsynlighed). Der er således belæg for at forkaste nulhypotesen.

På den anden side, hvis p-værdien var <0,65, ville man, hvis man antager, at nulhypotesen er sand, forvente at opnå det observerede resultat eller et mere ekstremt resultat i 65 % af tilfældene. Det er vel ikke alt for prangende, vel? I så fald ville nulhypotesen forblive sand. Jeg håber, at det hjælper dig med at forstå P-værdien.

Ja, for dem, der er nysgerrige, var de reelle resultater følgende:

Den lineære regressionsstatistik mellem den strakte penislængde og skostørrelse gav en r2 på 0,012 (P=0,28), hvilket tyder på, at der ikke er nogen statistisk signifikant sammenhæng mellem strakt penislængde og skostørrelse.

Interpretationen af p-værdien er:

Hvis nulhypotesen er sand (skostørrelse forudsiger ikke penislængde), ville den observerede effekt eller mere forekomme 28% af gangen.

KONFIDENSINTERVALS

Det andet begreb inden for præcision er konfidensintervaller (CI). I ovenstående undersøgelse er der ingen mulighed for at udtage en stikprøve af alle mænd i verden og måle deres skostørrelser eller penislængder.

Hvis man kunne det, ville man få den nøjagtige korrelationskoefficient eller gennemsnitsstørrelser for skostørrelsen og også for penislængden. Derfor er der behov for at angive et eller andet interval, mellem hvilket det sande mål ligger. Dette er konfidensintervallet.

Sædvanligvis er konfidensintervallet sat til 95 %, hvilket fortæller dig, at hvis du lavede denne undersøgelse 100 gange, ville 95 ud af 100 gange det sande mål ligge mellem de to konfidensintervaller.

Lad os se på en anden interessant undersøgelse.

Fodbold og hjerteanfald

Lad os se på et andet eksempel og forsøge at besvare følgende spørgsmål. Læs følgende undersøgelsesresultat i undersøgelsen af Wilbert-Lampen et al. Undersøgelsen undersøger sammenhængen mellem kardiovaskulære hændelser og VM i fodbold.

Kardiovaskulære hændelser ( læs = hjerteproblemer), der opstod hos patienter i det større München-område, blev prospektivt vurderet af akutlæger under VM i fodbold. Vi sammenlignede disse hændelser med hændelser, der fandt sted i kontrolperioden: 1. maj til 8. juni og 10. juli til 31. juli 2006 og 1. maj til 31. juli i 2003 og 2005.
Akutte kardiovaskulære hændelser blev vurderet hos 4279 patienter. På dage med kampe med deltagelse af det tyske hold var forekomsten af hjertelidelser 2,66 gange så høj som i kontrolperioden (95 % konfidensinterval , 2,33 til 3,04; P<0,001); for mænd var forekomsten 3.26 gange så høj som i kontrolperioden (95 % CI, 2,78 til 3,84; P<0,001), og for kvinder var den 1,82 gange så høj som i kontrolperioden (95 % CI, 1,44 til 2,31; P<0,001).

1. Var forekomsten af hjertestop statistisk signifikant, og hvorfor?
2. Har mænd en øget risiko for kardiovaskulære hændelser under VM-kampe? Er denne større end risikoen for kvinder? Er resultatet statistisk signifikant?
3. Endelig, bør der indføres større nødprocedurer under VM-begivenheder på baggrund af dette resultat? (Hint: Dette kræver subjektiv og analytisk tænkning og afhænger af mange variabler). Svarene findes til sidst.

Nøglepunkter

P-værdien i sig selv betyder intet. Den skal sættes ind i sammenhæng med undersøgelsens metodologi og effektmålet. P-værdier kan gøres signifikante ved at reducere målets robusthed ( f.eks. hvis benchmarkforbedringen er på 8 point, og man får et ikke-signifikant resultat, kan man ved at reducere benchmarken til 4 point få et statistisk signifikant resultat).

Men en forbedring på 4 point er ikke lige så god som en forbedring på 8 point. Fortolkningen er altid subjektiv, og det er her, at analytiske evner er vigtige. Det sikrer, at man ikke tager tingene for pålydende.

Iflg. Ioannidis’ slående artikel, Why Most Published Research Findings Are False:

Forskning er ikke mest hensigtsmæssigt repræsenteret og opsummeret ved p-værdier, men desværre er der en udbredt forestilling om, at medicinske forskningsartikler kun skal fortolkes ud fra p-værdierne.

I henhold til den nyligt udsendte erklæring fra ASA-

Den p-værdi har aldrig været tænkt som en erstatning for videnskabelig argumentation.

Med tiden ser det ud til, at p-værdien er blevet en gatekeeper for, om et arbejde kan publiceres, i hvert fald inden for nogle områder,….. Denne tilsyneladende redaktionelle skævhed fører til “arkivskuffereffekten”, hvor forskning med statistisk signifikante resultater er meget mere tilbøjelig til at blive offentliggjort, mens andet arbejde, der meget vel kunne være lige så vigtigt videnskabeligt set, aldrig kommer på tryk. Det fører også til praksis, der kaldes med navne som “p-hacking” og “data-dredging”, og som lægger vægt på at søge efter små p-værdier frem for andre statistiske og videnskabelige ræsonnementer.

En p-værdi eller statistisk signifikans måler ikke størrelsen af en effekt eller betydningen af et resultat.

P-værdier måler ikke sandsynligheden for, at den undersøgte hypotese er sand, eller sandsynligheden for, at dataene udelukkende er fremkommet ved tilfældigheder.

Videnskabelige konklusioner og forretningsmæssige eller politiske beslutninger bør ikke kun baseres på, om en p-værdi passerer en bestemt tærskel.

CI er det interval af værdier, som det sande populationsmål ligger mellem for et givet konfidensniveau.

Konfidensintervaller kan indsnævres ved at øge stikprøvens størrelse, da man begynder at komme tættere på det sande populationsmål ved at inkludere flere personer fra populationen.

SVAR

1. Ja, incidensen var statistisk signifikant som skitseret af p-værdien.
2. Mænd har en større risiko for hjerte-kar-hændelser end kvinder, og risikoen er statistisk signifikant. Se på CI- og P-værdierne.
3. Der er ingen faste svar, og der er behov for andre undersøgelser. Forskellige personer kan have forskellige måder at analysere disse data på.

Similar Posts

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.