Conception de l’étude
La littérature chirurgicale peut être classée de manière générale comme les articles qui s’intéressent principalement à la thérapie, au pronostic, aux dommages, à l’analyse économique ou ceux qui se concentrent sur des aperçus, pour n’en citer que quelques-uns.5 Au sein de chaque classification, il existe une hiérarchie des preuves, c’est-à-dire que certaines études sont mieux adaptées que d’autres, pour répondre à une question de thérapie, par exemple, et peuvent représenter plus précisément la « vérité ». La capacité d’une étude à le faire repose sur deux facteurs principaux, la conception de l’étude et la qualité de l’étude.3 Dans ce contexte, nous nous concentrerons en grande partie sur les études traitant de la thérapie, car il s’agit généralement de l’étude la plus courante dans la littérature de la chirurgie orthopédique.
La littérature thérapeutique disponible peut être largement classée en deux catégories : les études de nature observationnelle et les études ayant une conception expérimentale randomisée.2 La raison pour laquelle les études sont placées dans une hiérarchie est que celles qui sont au sommet sont considérées comme les « meilleures preuves ».5 Dans le cas des essais thérapeutiques, il s’agit de l’essai contrôlé randomisé (ECR) et des méta-analyses d’ECR. Les ECR ont en eux, de par la nature de la randomisation, une capacité à aider à contrôler les biais.6,7 Les biais (dont il existe de nombreux types) peuvent confondre les résultats d’une étude de telle sorte que l’étude peut surestimer ou sous-estimer le véritable effet du traitement.8 La randomisation permet d’atteindre cet objectif en contrôlant non seulement les variables pronostiques connues, mais aussi et surtout les variables pronostiques inconnues au sein d’un échantillon de population.7 En d’autres termes, la randomisation doit permettre de créer une distribution égale des variables pronostiques (connues et inconnues) dans les groupes de contrôle et de traitement d’une étude. Cette mesure de contrôle du biais permet d’obtenir une estimation plus précise de la vérité.6 Les études de nature plus observationnelle comportent dans leur conception des zones de biais qui ne sont pas présentes dans l’essai randomisé.
Les méta-analyses d’essais contrôlés randomisés utilisent en fait les données de chaque ECR et les regroupent statistiquement.5,9 Cela augmente effectivement le nombre de patients sur lesquels les données ont été obtenues, augmentant ainsi la taille effective de l’échantillon. Le principal inconvénient de ce regroupement est qu’il dépend de la qualité des ECR utilisés.9 Par exemple, si trois ECR sont en faveur d’un traitement et que deux ne le sont pas, ou si les résultats montrent une grande variation entre les estimations de l’effet du traitement avec de grands intervalles de confiance (c’est-à-dire que la précision de l’estimation ponctuelle de l’effet du traitement est faible) entre les différents ECR, alors il y a une ou plusieurs variables qui causent des résultats incohérents entre les études (une variable peut en fait être les différences de qualité des études, entre autres) et la qualité des résultats utilisables du regroupement statistique sera faible. En revanche, si l’on utilise cinq ECR bien réalisés sur le plan méthodologique, qui favorisent tous un traitement et présentent des mesures précises de l’effet du traitement (c’est-à-dire des intervalles de confiance étroits), les données obtenues par regroupement statistique sont beaucoup plus crédibles. Les premières études peuvent être qualifiées d’hétérogènes et les secondes d’homogènes.9
A l’inverse, le niveau le plus bas de la hiérarchie (hormis l’opinion d’expert) est le rapport de cas et la série de cas.3 Ceux-ci sont généralement de nature rétrospective et n’ont pas de groupe de comparaison. Ils ne peuvent fournir des résultats que pour un seul sous-groupe de la population (ceux qui bénéficient de l’intervention). Il existe un risque d’introduction de biais, en particulier si la collecte des données ou le suivi sont incomplets, ce qui peut se produire dans le cadre d’études rétrospectives. De plus, ces études sont généralement basées sur l’expérience d’un seul chirurgien ou centre, ce qui peut faire douter de la généralisation des résultats. Même avec ces inconvénients, ce type d’étude peut être utile à bien des égards. Ils peuvent être utilisés efficacement pour la génération d’hypothèses ainsi que pour fournir potentiellement des informations sur des entités pathologiques rares ou des complications qui peuvent être associées à certaines procédures ou implants. Par exemple, le rapport des taux d’infection à la suite d’une grande série de fractures tibiales traitées avec un clou intramédullaire alésé10 ou le taux de défaillance matérielle d’un implant particulier pour n’en citer que quelques-uns.
Le niveau d’étude suivant est le cas-témoin. Le cas-témoin part d’un groupe qui a eu un résultat d’intérêt et examine d’autres individus similaires pour voir quels facteurs peuvent avoir été présents dans le groupe d’étude et peuvent être associés au résultat. Prenons un exemple hypothétique. Les patients qui présentent un défaut de consolidation après une fracture de la diaphyse tibiale traitée par un clou intramédullaire. Si l’on voulait voir quels facteurs pronostiques ont pu y contribuer, on pourrait alors comparer un groupe apparié pour les variables pronostiques connues telles que l’âge, le type de traitement, le type de fracture, etc. et analyser d’autres variables pronostiques telles que le tabagisme, l’utilisation d’anti-inflammatoires non stéroïdiens ou le type de fracture pour voir s’il existe une association entre ces variables et le développement de la non-union. L’inconvénient de cette conception est qu’il peut y avoir des facteurs de risque inconnus ou non encore identifiés qui ne pourraient pas être analysés. Cependant, pour ceux qui sont connus, la force de l’association peut être déterminée et donnée sous la forme de rapports de cotes ou parfois de risques relatifs. Les autres avantages de ce type d’étude sont qu’elles sont généralement moins coûteuses à mettre en œuvre et qu’elles permettent de répondre plus rapidement à une question spécifique. Elles peuvent également permettre l’analyse de multiples facteurs pronostiques et des relations au sein de ces facteurs pour aider à déterminer les associations potentielles avec le résultat de choix (dans ce cas, la non-union).
Contrairement au cas-témoin et légèrement plus haut dans la hiérarchie des niveaux de preuve,3 l’étude de cohorte est généralement réalisée de manière prospective (bien qu’elle puisse être réalisée de manière rétrospective) et suit habituellement deux groupes de patients. L’un de ces groupes présente un facteur de risque ou un facteur pronostique d’intérêt et l’autre non. Les groupes sont suivis pour voir quel est le taux de développement d’une maladie ou d’une issue spécifique chez ceux qui présentent le facteur de risque par rapport à ceux qui ne le présentent pas. Étant donné que cette étude est généralement réalisée de manière prospective, elle se situe à un niveau plus élevé dans la hiérarchie, car la collecte et le suivi des données peuvent être surveillés de plus près et des efforts peuvent être faits pour les rendre aussi complètes et précises que possible. Ce type de conception d’étude peut être très puissant dans certains cas. Par exemple, si l’on voulait voir quel est l’effet du tabagisme sur les taux de non-union, il ne serait pas éthique ou généralement possible de randomiser les patients présentant des fractures entre ceux qui vont fumer et ceux qui ne le feront pas. Cependant, en suivant deux groupes de patients, des fumeurs et des non-fumeurs souffrant de fractures du tibia par exemple, on peut ensuite documenter les taux de non-union entre les deux groupes. Dans ce cas, en raison de sa conception prospective, les groupes peuvent au moins être appariés pour essayer de limiter le biais des variables pronostiques connues, comme l’âge, le type de fracture ou le type de traitement, pour n’en citer que quelques-unes.
Il est important de comprendre les distinctions entre les conceptions d’études. Certains chercheurs soutiennent que les études observationnelles bien construites mènent à des conclusions similaires à celles des ECR.11 Cependant, d’autres suggèrent que les études observationnelles ont un potentiel plus important de sur ou de sous-estimation des effets du traitement. En effet, des exemples sont présents dans les spécialités médicales et chirurgicales orthopédiques montrant que des résultats divergents peuvent être trouvés entre les essais randomisés et non randomisés.6,8,12 Un exemple non chirurgical récent de ce phénomène est le traitement hormonal substitutif chez les femmes ménopausées.13,14 Des études observationnelles antérieures ont suggéré qu’il y avait un effet significatif du traitement hormonal substitutif sur la densité osseuse avec un profil de risque favorable. Cependant, un grand ECR récent a révélé une incidence croissante d’événements cardiaques et autres événements indésirables chez les personnes suivant un traitement hormonal substitutif, risques qui avaient jusqu’à présent été sous-estimés par les études d’observation.13,14 En conséquence, la prise en charge de l’ostéoporose post-ménopausique a connu un changement dans le traitement de première intention.13 Dans la littérature orthopédique, il a été suggéré que lors de l’évaluation des essais randomisés et non randomisés utilisant des études sur l’arthroplastie par rapport à la fixation interne, les études non randomisées ont surestimé le risque de mortalité après une arthroplastie et sous-estimé le risque de révision chirurgicale avec une arthroplastie8. Il est intéressant de noter que dans les études non randomisées qui ont obtenu des résultats similaires à ceux des études randomisées, l’âge du patient, le sexe et le déplacement de la fracture ont été contrôlés entre les groupes.8 Cela illustre l’importance du contrôle des variables et de la randomisation qui contrôlera des variables potentiellement importantes mais encore inconnues.
Ainsi, le type de conception de l’étude utilisée place l’étude dans une hiérarchie de preuves allant de la série de cas à l’essai contrôlé randomisé. Il existe également, cependant, une hiérarchie interne au sein des niveaux globaux de preuve et cela est généralement basé sur la méthodologie de l’étude et la qualité globale.