Study design
A sebészeti szakirodalom nagyjából a következők szerint osztályozható: a terápiával, prognózissal, ártalmakkal, gazdasági elemzéssel foglalkozó cikkek, illetve az áttekintésekre összpontosító cikkek, hogy csak néhányat említsünk.5 Minden osztályozáson belül létezik a bizonyítékok hierarchiája, vagyis egyes tanulmányok jobban alkalmasak arra, hogy megválaszoljanak például egy terápiás kérdést, mint mások, és talán pontosabban képviselik az “igazságot”. Az, hogy egy tanulmány képes-e erre, két fő hozzájáruló tényezőn, a vizsgálati terven és a tanulmány minőségén múlik.3 Ebben az összefüggésben leginkább a terápiával foglalkozó tanulmányokra fogunk koncentrálni, mivel általában ez a leggyakoribb vizsgálat az ortopédiai sebészeti irodalomban.
A rendelkezésre álló terápiás irodalom nagyjából a megfigyeléses jellegű és a randomizált kísérleti tervezésű tanulmányok kategóriájába sorolható.2 A tanulmányok hierarchiába sorolását az indokolja, hogy a csúcson lévőket tekintik a “legjobb bizonyítéknak”.5 A terápiás vizsgálatok esetében ez a randomizált kontrollált vizsgálat (RCT) és az RCT-k metaanalízisei. Az RCT-k a randomizáció természetéből adódóan képesek az elfogultságok ellenőrzésére.6,7 Az elfogultságok (amelyeknek számos típusa létezik) megzavarhatják a vizsgálat eredményét, így a vizsgálat túl- vagy alulbecsülheti a kezelés valódi hatását.8 A randomizálás ezt úgy képes elérni, hogy nemcsak az ismert prognosztikai változókat ellenőrzi, hanem – ami még fontosabb – a mintapopuláción belül az ismeretlen prognosztikai változókat is.7 Vagyis a randomizálásnak képesnek kell lennie arra, hogy a vizsgálaton belül a kontroll- és a kezelési csoporton belül a prognosztikai változók (ismert és ismeretlen) egyenlő eloszlását hozza létre. Ez az elfogultság-szabályozó intézkedés segít az igazság pontosabb becslésének elérésében.6 Az inkább megfigyeléses jellegű tanulmányok tervezetükben olyan elfogultsági területek vannak, amelyek a randomizált vizsgálatban nincsenek jelen.
A randomizált kontrollált vizsgálatok metaanalízisei valójában az egyes RCT-kből származó adatokat használják fel, és statisztikailag egyesítik azokat.5,9 Ez hatékonyan növeli azon betegek számát, akiktől az adatokat nyerték, és ezáltal növeli a hatékony mintanagyságot. Ennek az összevonásnak az a fő hátránya, hogy a felhasznált RCT-k minőségétől függ.9 Ha például három RCT egy kezelés mellett szól, kettő pedig nem, vagy ha az eredmények nagy eltérést mutatnak a kezelési hatás becslései között, nagy konfidenciaintervallumokkal (azaz a kezelési hatás pontbecslésének pontossága gyenge) a különböző RCT-k között, akkor valamilyen változó (vagy változók) okoz ellentmondásos eredményeket a tanulmányok között (az egyik változó valójában a tanulmányok minőségében mutatkozó különbségek is lehetnek), és a statisztikai összevonásból származó felhasználható eredmények minősége gyenge lesz. Ha azonban öt módszertanilag jól elvégzett RCT-t használnak, amelyek mindegyike egy kezelést támogat, és a kezelés hatását pontosan mérik (azaz szűk konfidenciaintervallummal rendelkeznek), akkor a statisztikai összevonásból kapott adatok sokkal hihetőbbek. Az előbbi vizsgálatokat heterogénnek, az utóbbiakat homogénnek nevezhetjük.9
Ezzel szemben a hierarchia legalsó szintje (a szakértői véleményen kívül) az esetjelentés és az esetsorozat.3 Ezek általában retrospektív jellegűek, és nincs összehasonlító csoportjuk. Csak a populáció egy alcsoportjára (a beavatkozásban részesülőkre) vonatkozóan tudnak eredményeket szolgáltatni. Fennáll a torzítás lehetősége, különösen, ha az adatgyűjtés vagy a nyomon követés hiányos, ami a retrospektív vizsgálati tervek esetében előfordulhat. Emellett ezek a tanulmányok általában egyetlen sebész vagy központ tapasztalatain alapulnak, ami kétségeket ébreszthet az eredmények általánosíthatóságát illetően. E hátrányok ellenére ez a vizsgálati terv sok szempontból hasznos lehet. Hatékonyan használhatók hipotézisek felállítására, valamint potenciálisan információt szolgáltathatnak ritka betegségegyüttesekről vagy szövődményekről, amelyek bizonyos eljárásokhoz vagy implantátumokhoz társulhatnak. Például a fertőzési arányokról való beszámolás egy nagy sorozatú, kitömött intramedulláris szeggel10 kezelt sípcsonttörést követően, vagy egy adott implantátum hardverhibáinak aránya, hogy csak néhányat említsünk.
A vizsgálat következő szintje az eset-kontroll. Az eset-kontroll egy olyan csoporttal kezdődik, akiknél az érdeklődésre számot tartó kimenetel bekövetkezett, és visszatekint más hasonló egyénekre, hogy megnézze, milyen tényezők lehettek jelen a vizsgált csoportban, amelyek összefüggésbe hozhatók a kimenettel. Vegyünk egy hipotetikus példát. Azokat a betegeket, akiknél egy intramedulláris szeggel kezelt sípcsonttörést követően a csont nem egyesült. Ha meg akarnánk nézni, hogy milyen prognosztikai tényezők járulhattak hozzá ehhez, akkor össze lehetne hasonlítani egy olyan csoportot, amely megfelel az ismert prognosztikai változóknak, mint például az életkor, a kezelés típusa, a töréskép stb. tekintetében, és el lehetne végezni az egyéb prognosztikai változók, például a dohányzás, a nem szteroid gyulladáscsökkentők használata vagy a töréskép elemzését, hogy megnézzük, van-e összefüggés ezek és a nem-unió kialakulása között. Ennek a konstrukciónak az a hátránya, hogy lehetnek ismeretlen vagy még nem azonosított kockázati tényezők, amelyek nem lennének elemezhetőek. Azok esetében azonban, amelyek ismertek, az összefüggés erőssége meghatározható és esélyhányados vagy néha relatív kockázat formájában megadható. E vizsgálati terv további erőssége, hogy általában kevésbé költséges a kivitelezésük, és gyorsabb “választ” adhat egy adott kérdésre. Lehetővé tehetik továbbá több prognosztikai tényező és az ezeken belüli kapcsolatok elemzését, hogy segítsenek meghatározni a választott kimenetellel (ebben az esetben a nem egyesüléssel) való lehetséges összefüggéseket.
Az eset-kontrollal ellentétben és a bizonyítottsági szintek hierarchiájában kissé magasabb szinten3 a kohorszvizsgálat általában prospektív módon történik (bár retrospektív módon is elvégezhető), és általában két betegcsoportot követ. Az egyik csoportban fennáll az érdeklődésre számot tartó kockázati tényező vagy prognosztikai tényező, a másikban pedig nem. A csoportokat azért követik, hogy megállapítsák, milyen a betegség vagy egy adott kimenetel kialakulásának aránya a kockázati tényezővel rendelkezőknél a kockázati tényezővel nem rendelkezőkhöz képest. Mivel ezt általában prospektív módon végzik, a hierarchián belül magasabban helyezkedik el, mivel az adatgyűjtést és a nyomon követést szorosabban nyomon lehet követni, és meg lehet kísérelni, hogy azok a lehető legteljesebbek és legpontosabbak legyenek. Ez a fajta vizsgálati terv bizonyos esetekben nagyon hatékony lehet. Ha például azt szeretnénk látni, hogy a dohányzás milyen hatással van a nem-uniós arányokra, akkor nem lenne etikus vagy általában nem lenne lehetséges a törésekkel rendelkező betegeket randomizálni azokba, akik dohányozni fognak, és azokba, akik nem fognak dohányozni. Ha azonban két betegcsoportot követünk, dohányosokat és nemdohányzókat, akiknek például sípcsonttörésük van, akkor dokumentálhatjuk a két csoport közötti nem-uniós arányokat. Ebben az esetben a prospektív tervezés miatt a csoportokat legalább össze lehet egyeztetni, hogy megpróbáljuk korlátozni legalább az olyan ismert prognosztikai változók torzítását, mint például az életkor, a töréskép vagy a kezelés típusa, hogy csak néhányat említsünk.
Nagyon fontos megérteni a vizsgálati tervek közötti különbségeket. Egyes kutatók azt állítják, hogy a jól felépített megfigyeléses vizsgálatok hasonló következtetésekhez vezetnek, mint az RCT-k.11 Mások azonban azt állítják, hogy a megfigyeléses vizsgálatokban nagyobb a lehetőség a kezelés hatásainak túl- vagy alulbecslésére. Valóban, mind az orvosi, mind az ortopédiai sebészeti szakterületekről vannak példák arra, hogy a randomizált és a nem randomizált vizsgálatok között eltérő eredményeket lehet találni.6,8,12 Ennek egyik legújabb nem sebészeti példája a posztmenopauzában lévő nők hormonpótló terápiája.13,14 Korábbi megfigyeléses vizsgálatok azt sugallták, hogy a hormonpótló terápia jelentős hatást gyakorol a csontsűrűségre, kedvező kockázati profillal. Egy nemrégiben végzett nagy RCT azonban a hormonpótló terápiában részesülőknél a káros kardiális és egyéb nemkívánatos események növekvő előfordulását állapította meg, olyan kockázatokat, amelyeket a megfigyeléses vizsgálatok eddig alábecsültek.13,14 Ennek eredményeképpen a posztmenopauzális osteoporosis kezelése az első vonalbeli terápiában változott.13 Az ortopédiai szakirodalomban felvetették, hogy a randomizált és nem randomizált vizsgálatok értékelése során az arthroplastika vs. belső rögzítés vizsgálatai alapján a nem randomizált vizsgálatok túlbecsülték az arthroplastikát követő halálozás kockázatát, és alábecsülték az arthroplastikával járó revíziós műtétek kockázatát.8 Érdekes módon azt is megállapították, hogy azokban a nem randomizált tanulmányokban, amelyek a randomizált tanulmányokhoz hasonló eredményeket kaptak, a betegek életkorát, nemét és a törés elmozdulását kontrollálták a csoportok között.8 Ez jól szemlélteti mind a változók kontrolljának, mind a randomizációnak a fontosságát, amely kontrollálja a potenciálisan fontos, de még ismeretlen változókat.
Az alkalmazott vizsgálati terv típusa tehát a vizsgálatot nagyjából a bizonyítékok hierarchiájába helyezi, az esetsorozattól egészen a randomizált kontrollált vizsgálatig. A bizonyítékok általános szintjein belül is létezik azonban egy belső hierarchia, és ez általában a tanulmány módszertanán és általános minőségén alapul.