“Ville du være villig til at springe ud af dette fly uden faldskærm?”
I det sidste år har vi stillet dette spørgsmål midt under flyvningen til snesevis af intetanende rejsende, der sidder på kommercielle flyvemaskiner.
Hvorfor ville vi stille et så latterligt spørgsmål? Det er måske på sin plads med lidt baggrund. I 2003 offentliggjorde Smith og Pell en systematisk gennemgang med tungen på vægtskålen, som konkluderede, at der ikke fandtes nogen randomiserede kliniske forsøg (RCT’er), der evaluerede effektiviteten af faldskærme med hensyn til at forebygge større traumer i forbindelse med “gravitationel udfordring”. De argumenterede for, at de “mest radikale forkæmpere for evidensbaseret medicin” skulle melde sig frivilligt til at deltage i et randomiseret, dobbeltblindet forsøg med faldskærmen. I de to årtier, der er gået siden udgivelsen af dette banebrydende arbejde i BMJ’s julenummer, har faldskærmen været et forbillede for biologisk plausibilitet. Anekdoternes redningsmand. Den evidensbaserede medicins ærkefjende. Der går ikke en uge, uden at en hovedrystende kollega minder os om, at faldskærmen ikke er blevet testet i en RCT.
Det PARACHUTE-forsøg er vores satiriske forsøg på at bringe faldskærmen og den almægtige RCT tilbage på jorden.
Den kendsgerning, at ingen nogensinde ville hoppe ud af et fly uden faldskærm, er ofte blevet brugt som argument for, at det ville være uhensigtsmæssigt at randomisere folk til enten en potentielt livreddende medicinsk intervention eller en kontrol, og at effektiviteten af en sådan intervention alene bør afgøres ud fra en klinisk vurdering. Vi er i det store og hele uenige. Vi mener, at randomisering er afgørende for at vurdere fordele og ulemper ved langt de fleste moderne behandlinger, hvoraf de fleste sandsynligvis ikke er nær så effektive til at nå deres slutmål, som faldskærme er til at forebygge skader blandt folk, der hopper fra fly.
Derimod er RCT’er sårbare over for forud eksisterende overbevisninger om standardbehandling, uanset om disse overbevisninger er berettigede eller ej. Vores forsøg på at rekruttere passagerer under flyvning til vores ambitiøse forsøg blev først mødt med spørgende blikke og vantro, som forudsigeligt blev efterfulgt af et bestemt “Nej, jeg ville ikke hoppe uden faldskærm”. For størstedelen af den screenede population i PARACHUTE-forsøget var der ikke nogen equipoise – faldskærme er den fremherskende standard for pleje. Og vi er enige.
Men hvad nu, hvis vi gav forsikringer om, at flyene var stationære og på jorden, og at springet kun ville være et par meter? Det var på dette tidspunkt, at vores undersøgelse tog fart. Vi tog af sted i to grupper, den ene på Katama Airfield på Martha’s Vineyard og den anden på Yankee Air Museum i Ann Arbor. En efter en sprang vores forsøgspersoner ud fra enten en lille biplan eller en helikopter og blev tilfældigt udvalgt til enten en rygsæk udstyret med en faldskærm eller en look-a-like kontrol. Som lovet blev begge fly parkeret sikkert på fast grund. Kampen blev, ikke overraskende, uafgjort, og ingen af grupperne kom til skade. I det første RCT nogensinde om faldskærme var den overordnede konklusion klar: faldskærme reducerede ikke antallet af dødsfald eller alvorlige traumatiske skader blandt personer, der sprang fra fly.
Men de overordnede resultater af RCT’er afslører ofte ikke hele historien. Vi gennemførte PARACHUTE-forsøget for at illustrere de farer, der er forbundet med at fortolke forsøg uden for kontekst. Når der findes stærke overbevisninger om behandlingsstandarden i samfundet, indskrives ofte kun lavrisikopatienter i et forsøg, hvilket kan forvrænge resultaterne i ubodelig grad, svarende til at hoppe ud af et fly uden faldskærm. Hvis man antager, at resultaterne af et sådant forsøg kan generaliseres til den bredere befolkning, kan det få katastrofale konsekvenser.
Hvor du drager den konklusion, at vi foreslår, at vi smider RCT’er ud af den kliniske forskning, så lad os præcisere, at det ikke er vores hensigt. I en ideel verden ville nye interventioner altid blive omhyggeligt evalueret gennem strenge RCT’er, før de bliver udbredt. Men når allerede eksisterende overbevisninger om en uprøvet intervention påvirker den indskrevne population, kan selv et veludført RCT give misvisende resultater. Uden omhyggelig opmærksomhed på konteksten kan det at ekstrapolere resultaterne fra en sådan RCT til patienten foran os være, ja, et spring for langt.
Robert W. Yeh er lektor i medicin ved Harvard Medical School.
Dhruv Kazi er associeret direktør for Richard A. and Susan F. Smith Center for Outcomes Research in Cardiology ved Beth Israel Deaconess Medical Center.