Az Ön útmutatója a P-értékekhez és a konfidenciaintervallumokhoz – Cipőméret, péniszhossz, futball és szívroham!

author
8 minutes, 7 seconds Read
A FELSZERELÉS ÉS A PENILISZ HOSSZA

A cipőméret előrejelzi a pénisz hosszát? Nem viccelek, ez egy valódi tanulmány.

1. lépés: Állítsuk fel a nullhipotézist: Nincs kapcsolat a cipőméret és a pénisz hossza között VAGY A cipőméret nem jelzi előre a pénisz hosszát. A vizsgálat célja ennek a hipotézisnek az elutasítása lenne, ami az alternatív hipotézisnek kedvezne; azaz: Van kapcsolat a cipőméret és a pénisz hossza között VAGY a cipőméret előrejelzi a pénisz hosszát (három lehetőség van ; nincs korreláció, pozitív vagy negatív korreláció)

2. lépés: Két urológus egy prospektív vizsgálatban 104 férfi megnyújtott péniszhosszát mérte meg, és ezt a cipőmérettel hozta összefüggésbe.

3. lépés: Az eredményeket statisztikailag értékelték a legkisebb négyzetek regressziós modelljével, a szignifikancia szintnek pedig P<0,05-et választottak.

P-érték

Tegyük fel, hogy pozitív eredményt kaptak, azaz a pénisz hossza nő a cipőmérettel. Hogyan lehetsz biztos abban, hogy ez az összefüggés statisztikailag szignifikáns volt, vagy más szóval mennyire támasztják alá a minta adatai azt az érvet, hogy a nullhipotézis igaz ? Itt jön a képbe a p-érték. A p-érték korrigálja a bizonytalanságot azáltal, hogy megmondja, mennyire valószínű az adatokban megfigyelt hatás, ha a nullhipotézis igaz lenne.

Itt az Amerikai Statisztikai Egyesület (ASA) meghatározása:

p-érték az a valószínűség egy meghatározott statisztikai modell szerint, hogy az adatok statisztikai összegzése (például két összehasonlított csoport közötti mintaátlag-különbség) egyenlő vagy szélsőségesebb legyen, mint a megfigyelt értéke

Ha a statisztikai szignifikanciát 0-nál állapította meg.05, akkor a <0,05 p-érték azt mondja, hogy – feltéve, hogy a nullhipotézis igaz – nagyon kicsi a valószínűsége annak, hogy olyan eredményt kapunk, amely egyenlő vagy szélsőségesebb a megfigyelt eredménynél. ( 1 a 20-hoz vagy 5%-os valószínűséggel). Tehát van bizonyíték a nullhipotézis elutasítására.

Másrészt, ha a p-érték <0,65 lenne, akkor a nullhipotézis igaznak feltételezve azt várnánk, hogy az esetek 65%-ában a megfigyelt vagy szélsőségesebb eredményt kapjuk. Ez nem túl villámgyors, ugye? A nullhipotézis ekkor igaz maradna. Remélem, ez segít megérteni a P-értéket.

Hát azoknak, akik kíváncsiak, a valódi eredmények a következők voltak:

A megnyújtott péniszhossz és a cipőméret közötti lineáris regressziós statisztika 0,012-es r2-t adott (P=0,28), ami arra utal, hogy nincs statisztikailag szignifikáns kapcsolat a megnyújtott péniszhossz és a cipőméret között.

A p-érték értelmezése a következő:

Feltételezve, hogy a nullhipotézis igaz (a cipőméret nem jelzi előre a péniszhosszat), a megfigyelt hatás vagy annál több az esetek 28%-ában fordulna elő.

BIZONYOSSÁGI INTERVOLUMOK

A pontosság másik fogalma a bizalmi intervallum (CI). A fenti vizsgálatban nincs mód arra, hogy a világ összes férfiból mintát vegyünk, és megmérjük a cipőméretüket vagy a péniszhosszukat.

Ha megtehetnénk, megkapnánk a pontos korrelációs együtthatót vagy az átlagos méreteket a cipőméretre és a péniszhosszra is. Ezért szükség van valamilyen tartomány megadására, amely között a valódi mérőszám fekszik. Ez a konfidenciaintervallum.

A konfidenciaintervallumot általában 95%-ban határozzák meg, ami azt jelenti, hogy ha 100-szor végeznénk el ezt a vizsgálatot, 100-ból 95 alkalommal a valódi mérték a két konfidenciaintervallum között feküdne.

Nézzünk egy másik érdekes vizsgálatot.

FOOTBALL AND HEART ATTACKS

Nézzünk egy másik példát, és próbáljunk meg válaszolni a következő kérdésekre. Olvassa el az alábbi tanulmány eredményét Wilbert-Lampen et al. tanulmányában. A tanulmány a kardiovaszkuláris események és a labdarúgó-világbajnokság közötti összefüggést vizsgálja.

A München nagy területén élő betegeknél előforduló kardiovaszkuláris eseményeket ( olvasd = szívproblémák) a világbajnokság ideje alatt a sürgősségi orvosok prospektíven értékelték. Ezeket az eseményeket összehasonlítottuk a kontrollidőszakban bekövetkezett eseményekkel: május 1-től június 8-ig és 2006. július 10-től július 31-ig, valamint 2003-ban és 2005-ben május 1-től július 31-ig.
Az akut kardiovaszkuláris eseményeket 4279 betegnél értékelték. A német csapatot érintő mérkőzések napjain a kardiológiai vészhelyzetek előfordulása 2,66-szorosa volt a kontroll időszakban tapasztaltaknak (95%-os konfidenciaintervallum , 2,33-3,04; P<0,001); a férfiak esetében az incidencia 3 volt.26-szorosa volt, mint a kontroll időszak alatt (95%-os konfidencia, 2,78-3,84; P<0,001), a nők esetében pedig 1,82-szerese volt a kontroll időszak alatt (95%-os konfidencia, 1,44-2,31; P<0,001).

1. Statisztikailag szignifikáns volt-e a kardiológiai vészhelyzetek előfordulása és miért?
2. Megnövekedett-e a férfiaknál a kardiovaszkuláris események kockázata a világbajnoki mérkőzések alatt? Nagyobb ez a kockázat, mint a nők esetében? Statisztikailag szignifikáns-e az eredmény?
3. Végül, ezen eredmény alapján nagyobb sürgősségi eljárásokat kellene-e bevezetni a világbajnoki események során? (Tipp: Ez szubjektív és analitikus gondolkodást igényel, és sok változótól függ). Válaszok a végén.

FONTOS LÉNYEGEK

A p-érték önmagában semmit sem jelent. A vizsgálat módszertanának és a hatás mértékének összefüggésébe kell helyezni. A p-értékek szignifikánssá tehetők a mérőszám robusztusságának csökkentésével ( pl. ha a referenciaérték javulása 8 pont, és nem szignifikáns eredményt kapunk, a referenciaérték 4 pontra való csökkentésével statisztikailag szignifikáns eredményt kaphatunk).

De a 4 pontos javulás nem olyan jó, mint a 8 pontos javulás. Az értelmezés mindig szubjektív, és itt fontosak az elemzői készségek. Ez biztosítja, hogy ne vegyük a dolgokat névértéken.

A Ioannidis frappáns cikke szerint: Why Most Published Research Findings Are False:

A kutatásokat nem a p-értékek mutatják be és foglalják össze a legmegfelelőbben, de sajnos elterjedt az a felfogás, hogy az orvosi kutatási cikkeket csak a p-értékek alapján kell értelmezni.

Az ASA nemrég kiadott nyilatkozata szerint

A p-értéket soha nem arra szánták, hogy helyettesítse a tudományos érvelést.

Az idők során úgy tűnik, hogy a p-érték a kapuőrévé vált annak, hogy a munka publikálható-e, legalábbis bizonyos területeken,…… Ez a nyilvánvaló szerkesztői részrehajlás az “irattartó effektushoz” vezet, amelyben a statisztikailag szignifikáns eredményekkel rendelkező kutatások sokkal nagyobb valószínűséggel kerülnek publikálásra, míg más, tudományosan ugyanolyan fontos munkák soha nem kerülnek nyomtatásba. Ez olyan gyakorlatokhoz is vezet, amelyeket “p-hacking”-nek és “data dredging”-nek neveznek, és amelyek a kis p-értékek keresését helyezik előtérbe más statisztikai és tudományos érveléssel szemben.

A p-érték vagy a statisztikai szignifikancia nem a hatás nagyságát vagy az eredmény fontosságát méri.

A p-értékek nem azt a valószínűséget mérik, hogy a vizsgált hipotézis igaz, vagy annak a valószínűségét, hogy az adatokat kizárólag a véletlen hozta létre.

A tudományos következtetéseket és az üzleti vagy politikai döntéseket nem szabad csak arra alapozni, hogy a p-érték átlép-e egy bizonyos küszöbértéket.

A p-érték az az értéktartomány, amely között a valódi populációs mérték egy adott konfidenciaszintre esik.

A konfidenciaintervallumok a minta méretének növelésével szűkíthetők, mivel a populációból több ember bevonásával kezdünk közelebb kerülni a valódi populációs mértékhez.

VÁLASZOK

1. Igen, az incidencia statisztikailag szignifikáns, amint azt a p-érték felvázolja.
2. A férfiaknál nagyobb a szív- és érrendszeri események kockázata, mint a nőknél, és ez a kockázat statisztikailag szignifikáns. Nézze meg a CI és a P-értékeket.
3. Nincsenek fix válaszok, és további vizsgálatokra van szükség. Különböző emberek különböző módon elemezhetik ezeket az adatokat.

Similar Posts

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.