Váš průvodce hodnotami P a intervaly spolehlivosti – velikost bot, délka penisu, fotbal a infarkty!

author
6 minutes, 54 seconds Read
Velikost bot a délka penisu

Předpovídá velikost bot délku penisu? Nedělám si legraci, tohle je skutečná studie.

Krok 1: Stanovte nulovou hypotézu: Neexistuje žádný vztah mezi velikostí obuvi a délkou penisu NEBO velikost obuvi nepředpovídá délku penisu. Cílem studie by bylo tuto hypotézu zamítnout, což by pak bylo ve prospěch alternativní hypotézy; tj. existuje vztah mezi velikostí bot a délkou penisu NEBO velikost bot předpovídá délku penisu (existují tři možnosti ; žádná korelace, pozitivní nebo negativní korelace)

Krok 2: Dva urologové měřili v prospektivní studii délku nataženého penisu 104 mužů a vztahovali ji k velikosti jejich bot.

Krok 3: Výsledky byly statisticky vyhodnoceny pomocí regresního modelu nejmenších čtverců, přičemž hladina významnosti byla zvolena P<0,05.

P value

Teď řekněme, že jste získali pozitivní výsledek, tj. délka penisu se zvyšuje s velikostí bot. Jak si můžete být jisti, že tato korelace byla statisticky významná, nebo jinými slovy, nakolik data z výběrového souboru podporují tvrzení, že nulová hypotéza je pravdivá ? Zde přichází na řadu hodnota p. Hodnota p upravuje nejistotu tím, že vám říká, jak pravděpodobný je efekt pozorovaný ve vašich datech, pokud by nulová hypotéza byla pravdivá.

Tady je definice Americal Statistical Association (ASA):

P-hodnota je pravděpodobnost, že při určitém statistickém modelu bude statistický souhrn dat (například výběrový průměrný rozdíl mezi dvěma porovnávanými skupinami) stejný nebo extrémnější než jeho pozorovaná hodnota

Pokud jste stanovili statistickou významnost na 0.05, pak hodnota p <0,05 vám říká, že za předpokladu pravdivosti nulové hypotézy existuje velmi malá pravděpodobnost získání výsledku, který je stejný nebo extrémnější než pozorovaný výsledek. ( 1 ku 20 neboli 5% pravděpodobnost). Existuje tedy důkaz pro zamítnutí nulové hypotézy.

Na druhé straně, pokud by hodnota p byla <0,65, pak za předpokladu, že nulová hypotéza je pravdivá, byste očekávali, že v 65 % případů získáte pozorovaný výsledek nebo výsledek extrémnější. To není příliš bleskové, že? Nulová hypotéza by pak zůstala pravdivá. Doufám, že vám to pomůže pochopit hodnotu P.

No a pro ty, které to zajímá, skutečné výsledky byly následující:

Lineární regresní statistika mezi délkou nataženého penisu a velikostí obuvi dala r2 0,012 (P=0,28), což naznačuje, že mezi délkou nataženého penisu a velikostí obuvi není statisticky významný vztah.

Interpretace p hodnoty je:

Předpokládáme-li, že nulová hypotéza je pravdivá (velikost bot nepředpovídá délku penisu), pozorovaný účinek nebo více by se vyskytl ve 28 % případů.

INTERVALY DŮVĚRY

Dalším pojmem v oblasti přesnosti jsou intervaly spolehlivosti (CI). Ve výše uvedené studii není možné odebrat vzorek všech mužů na světě a změřit jejich velikost bot nebo délku penisu.

Pokud by to bylo možné, získali bychom přesný korelační koeficient nebo střední velikosti pro velikost bot a také pro délku penisu. Proto je třeba uvést nějaké rozmezí, mezi kterým leží skutečná míra. To je interval spolehlivosti.

Obvykle se interval spolehlivosti stanovuje na 95 %, což říká, že kdybyste tuto studii provedli 100krát, v 95 ze 100 případů by skutečná míra ležela mezi oběma intervaly spolehlivosti.

Podívejme se na další zajímavou studii.

FOTBAL A SRDEČNÍ PŘÍHODY

Podívejme se na další příklad a pokusme se odpovědět na následující otázky. Přečtěte si následující výsledek studie Wilbert-Lampen et al. Studie zkoumá souvislost mezi kardiovaskulárními příhodami a mistrovstvím světa ve fotbale.

Kardiovaskulární příhody ( čti = srdeční potíže) vyskytující se u pacientů v širší oblasti Mnichova byly prospektivně hodnoceny lékaři pohotovostních služeb během mistrovství světa ve fotbale. Tyto příhody jsme porovnávali s příhodami, které se vyskytly v kontrolním období: 1. května až 8. června a 10. července až 31. července 2006 a 1. května až 31. července v letech 2003 a 2005.
Akutní kardiovaskulární příhody byly hodnoceny u 4279 pacientů. Ve dnech zápasů, kterých se účastnil německý tým, byl výskyt srdečních příhod 2,66krát vyšší než v kontrolním období (95% interval spolehlivosti , 2,33 až 3,04; P<0,001); u mužů byl výskyt 3krát vyšší.26krát vyšší než v kontrolním období (95% interval spolehlivosti, 2,78 až 3,84; P<0,001) a u žen byla 1,82krát vyšší než v kontrolním období (95% interval spolehlivosti, 1,44 až 2,31; P<0,001).

1. Byl výskyt srdečních příhod statisticky významný a proč?“
2. Mají muži během zápasů mistrovství světa zvýšené riziko kardiovaskulárních příhod? Je toto riziko vyšší než u žen? Je výsledek statisticky významný?
3. A konečně, měly by být na základě tohoto výsledku zavedeny větší nouzové postupy během akcí mistrovství světa? (Nápověda: To vyžaduje subjektivní a analytické myšlení a závisí na mnoha proměnných). Odpovědi najdete na konci.

KLÍČOVÉ VÝCHOZÍ BODY

Sama o sobě p-hodnota nic neznamená. Je třeba ji zasadit do kontextu metodiky studie a míry účinku. Hodnotu P lze učinit významnou snížením robustnosti míry ( např. pokud je referenční zlepšení 8 bodů a dostanete nesignifikantní výsledek, snížením referenční hodnoty na 4 body můžete získat statisticky významný výsledek).

Zlepšení o 4 body však není tak dobré jako zlepšení o 8 bodů. Interpretace je vždy subjektivní a právě zde jsou důležité analytické schopnosti. Zajistí, že nebudete brát věci za bernou minci.

Podle Ioannidisova úderného článku Why Most Published Research Findings Are False:

Výzkum není nejvhodněji reprezentován a shrnut pomocí p-hodnot, ale bohužel je rozšířená představa, že lékařské výzkumné články by měly být interpretovány pouze na základě p-hodnot.

Podle nedávno vydaného prohlášení ASA-

Nikdy nebyla p-hodnota zamýšlena jako náhrada vědeckého uvažování.

Časem se zdá, že se p-hodnota stala hlídačem toho, zda je práce publikovatelná, alespoň v některých oborech,….. Toto zjevné redakční zkreslení vede k „efektu šuplíku se soubory“, kdy se výzkumy se statisticky významnými výsledky mnohem častěji publikují, zatímco jiné práce, které by mohly být z vědeckého hlediska stejně důležité, se nikdy nedostanou do tisku. Vede také k praktikám označovaným názvy jako „p-hacking“ a „data dredging“, které kladou důraz na hledání malých p-hodnot nad ostatní statistické a vědecké úvahy.

P-hodnota neboli statistická významnost neměří velikost účinku ani důležitost výsledku.

P-hodnoty neměří pravděpodobnost, že zkoumaná hypotéza je pravdivá, ani pravděpodobnost, že data vznikla pouze náhodou.

Vědecké závěry a obchodní či politická rozhodnutí by neměly být založeny pouze na tom, zda p-hodnota překročí určitou hranici.

CI je interval hodnot, mezi nimiž leží skutečná populační míra pro danou hladinu spolehlivosti.

Intervaly spolehlivosti lze zužovat zvětšováním velikosti vzorku, protože zařazením většího počtu osob z populace se začnete blížit skutečné populační míře.

ODPOVĚDI

1. Ano, výskyt byl statisticky významný, jak je nastíněno p-hodnotou.
2. Muži mají větší riziko kardiovaskulárních příhod než ženy a toto riziko je statisticky významné. Podívejte se na CI a hodnoty P.
3. Neexistují žádné pevné odpovědi a je třeba provést další studie. Různí lidé mohou mít různé způsoby analýzy těchto údajů.

.

Similar Posts

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.