La tua guida ai valori P e agli intervalli di confidenza – Misura delle scarpe, lunghezza del pene, calcio e attacchi di cuore!

author
6 minutes, 9 seconds Read
TAGLIA DELLE SCARPE E LUNGHEZZA DEL PENE

La misura delle scarpe predice la lunghezza del pene? Non sto scherzando, questo è un vero studio.

Passo 1: Dichiarare l’ipotesi nulla: Non c’è relazione tra il numero di scarpe e la lunghezza del pene OPPURE il numero di scarpe non predice la lunghezza del pene. Lo scopo dello studio sarebbe quello di rifiutare questa ipotesi, il che favorirebbe l’ipotesi alternativa; cioè c’è una relazione tra il numero di scarpe e la lunghezza del pene OPPURE il numero di scarpe predice la lunghezza del pene (ci sono tre possibilità: nessuna correlazione, una correlazione positiva o negativa)

Passo 2: Due urologi hanno misurato la lunghezza allungata del pene di 104 uomini in uno studio prospettico e l’hanno collegata al loro numero di scarpe.

Passo 3: I risultati sono stati valutati statisticamente usando un modello di regressione dei minimi quadrati, con il livello di significatività scelto come P<0,05.

P value

Ora diciamo che hai ottenuto un risultato positivo, cioè la lunghezza del pene aumenta con il numero di scarpe. Come potete essere sicuri che questa correlazione sia statisticamente significativa o in altre parole quanto bene i dati del campione supportano la tesi che l’ipotesi nulla sia vera? È qui che entra in gioco il valore p. Il valore p aggiusta per l’incertezza, dicendovi quanto è probabile l’effetto osservato nei vostri dati se l’ipotesi nulla fosse vera.

Ecco la definizione dell’Americal Statistical Association (ASA):

Il valore p è la probabilità sotto un modello statistico specificato che un riassunto statistico dei dati (per esempio, la differenza media del campione tra due gruppi comparati) sia uguale o più estrema del suo valore osservato

Se avete stabilito la significatività statistica a 0.05, allora un valore p di <0,05 vi dice che, assumendo che l’ipotesi nulla sia vera, c’è una probabilità molto piccola di ottenere un risultato che è uguale o più estremo del risultato osservato. ( 1 su 20 o 5% di probabilità). Quindi, ci sono prove per rifiutare l’ipotesi nulla.

D’altra parte se il valore p era <0.65 allora assumendo che l’ipotesi nulla sia vera, ci si aspetta di ottenere il risultato osservato o più estremo il 65% delle volte. Non è un’ipotesi troppo folgorante, vero? L’ipotesi nulla rimarrebbe quindi vera. Spero che questo vi aiuti a capire il valore P.

Bene, per coloro che sono curiosi, i risultati reali sono stati i seguenti:

La statistica di regressione lineare tra la lunghezza del pene allungato e le dimensioni delle scarpe ha dato un r2 di 0,012 (P=0,28), suggerendo nessuna relazione statisticamente significativa tra lunghezza del pene allungato e dimensioni delle scarpe.

L’interpretazione del valore p è:

Assumendo che l’ipotesi nulla sia vera (il numero di scarpe non predice la lunghezza del pene), l’effetto osservato o più si verificherebbe il 28% delle volte.

INTERVALLI DI CONFIDENZA

L’altro concetto di precisione sono gli intervalli di fiducia (CI). Nello studio di cui sopra, non c’è modo di campionare tutti gli uomini del mondo e misurare le loro misure di scarpe o la lunghezza del pene.

Se si potesse, si otterrebbe l’esatto coefficiente di correlazione o le misure medie per la misura delle scarpe e anche per la lunghezza del pene. Perciò c’è bisogno di fornire un certo intervallo tra cui si trova la misura vera. Questo è l’intervallo di confidenza.

Di solito, l’intervallo di confidenza è fissato al 95%, il che ti dice che se tu facessi questo studio 100 volte, 95 volte su 100, la misura vera si troverebbe tra i due intervalli di confidenza.

Guardiamo un altro studio interessante.

FOOTBALL E ATTACCHI DI CUORE

Guardiamo un altro esempio e proviamo a rispondere alle seguenti domande. Leggete il seguente risultato dello studio di Wilbert-Lampen et al. Lo studio esamina l’associazione tra eventi cardiovascolari e la Coppa del Mondo di calcio.

Eventi cardiovascolari (leggi = problemi cardiaci) che si sono verificati in pazienti nell’area maggiore di Monaco sono stati valutati prospetticamente dai medici di emergenza durante la Coppa del Mondo. Abbiamo confrontato questi eventi con quelli che si sono verificati durante il periodo di controllo: Dal 1° maggio all’8 giugno e dal 10 al 31 luglio 2006, e dal 1° maggio al 31 luglio nel 2003 e nel 2005.
Eventi cardiovascolari acuti sono stati valutati in 4279 pazienti. Nei giorni di partite che coinvolgono la squadra tedesca, l’incidenza di emergenze cardiache era 2,66 volte quella durante il periodo di controllo (intervallo di confidenza 95%, 2,33 a 3,04; P<0,001); per gli uomini, l’incidenza era 3.26 volte quella del periodo di controllo (95% CI, 2,78 a 3,84; P<0,001), e per le donne, era 1,82 volte quella del periodo di controllo (95% CI, 1,44 a 2,31; P<0,001).

1. L’incidenza delle emergenze cardiache era statisticamente significativa e perché?
2. Gli uomini hanno un rischio aumentato di eventi cardiovascolari durante le partite di coppa del mondo? Questo è maggiore del rischio per le donne? Il risultato è statisticamente significativo?
3. Infine, dovrebbero essere messe in atto maggiori procedure di emergenza durante gli eventi della Coppa del Mondo sulla base di questo risultato? (Suggerimento: questo richiede un pensiero soggettivo e analitico e dipende da molte variabili). Risposte alla fine.

PUNTI CHIAVE DA PRENDERE

Il valore p da solo non significa nulla. Deve essere messo nel contesto della metodologia dello studio e della misura dell’effetto. I valori P possono essere resi significativi riducendo la robustezza della misura (ad esempio, se il miglioramento del benchmark è di 8 punti e si ottiene un risultato non significativo, riducendo il benchmark a 4 punti, si può ottenere un risultato statisticamente significativo).

Ma un miglioramento di 4 punti non è buono come un miglioramento di 8 punti. L’interpretazione è sempre soggettiva, ed è qui che le capacità analitiche sono importanti. Assicura che non si prendono le cose al valore nominale.

Secondo il suggestivo articolo di Ioannidis, Why Most Published Research Findings Are False:

La ricerca non è rappresentata e riassunta in modo più appropriato dai valori di p, ma, sfortunatamente, c’è una nozione diffusa che gli articoli di ricerca medica dovrebbero essere interpretati basandosi solo sui valori di p.

Secondo la dichiarazione recentemente rilasciata dall’ASA-

Il valore di p non è mai stato inteso come un sostituto del ragionamento scientifico.

Con il tempo sembra che il valore di p sia diventato un guardiano per stabilire se il lavoro è pubblicabile, almeno in alcuni campi,….. Questo apparente pregiudizio editoriale porta all'”effetto cassetto”, in cui le ricerche con risultati statisticamente significativi hanno molte più probabilità di essere pubblicate, mentre altri lavori che potrebbero essere altrettanto importanti dal punto di vista scientifico non vengono mai stampati. Porta anche a pratiche chiamate con nomi come ‘p-hacking’ e ‘data dredging’ che enfatizzano la ricerca di piccoli valori di p rispetto ad altri ragionamenti statistici e scientifici.

Un valore di p, o significatività statistica, non misura la dimensione di un effetto o l’importanza di un risultato.

I valori di p non misurano la probabilità che l’ipotesi studiata sia vera, o la probabilità che i dati siano stati prodotti solo dal caso.

Le conclusioni scientifiche e le decisioni aziendali o politiche non dovrebbero essere basate solo sul fatto che un valore di p superi una soglia specifica.

L’IC è l’intervallo di valori tra cui si trova la vera misura della popolazione per un dato livello di confidenza.

Gli intervalli di confidenza possono essere ridotti aumentando la dimensione del campione, poiché si comincia ad avvicinarsi alla vera misura della popolazione includendo più persone dalla popolazione.

RISPONDE

1. Sì, l’incidenza era statisticamente significativa come delineato dal p-value.
2. Gli uomini hanno un rischio maggiore di eventi cardiovascolari rispetto alle donne, e il rischio è statisticamente significativo. Guarda il CI e i valori P.
3. Non ci sono risposte fisse, e sono necessari altri studi. Persone diverse possono avere modi diversi di analizzare questi dati.

.

Similar Posts

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.