Desenho do estudo
A literatura cirúrgica pode ser classificada de forma ampla como aqueles artigos com interesse primário em terapia, prognóstico, dano, análise econômica ou aqueles focados em visões gerais para citar alguns.5 Dentro de cada classificação há uma hierarquia de evidência, ou seja, alguns estudos são mais adequados do que outros, para responder a uma questão de terapia, por exemplo, e podem representar mais precisamente a “verdade”. A capacidade de um estudo para fazer isso repousa em dois fatores principais, o desenho do estudo e a qualidade do estudo.3 Neste contexto, vamos nos concentrar, em grande parte, nos estudos que abordam a terapia, já que este é geralmente o estudo mais comum na literatura cirúrgica ortopédica.
A literatura terapêutica disponível pode ser amplamente categorizada como aqueles estudos de natureza observacional e aqueles estudos que têm um desenho experimental randomizado.2 A razão pela qual os estudos são colocados em uma hierarquia é que aqueles no topo são considerados a “melhor evidência”.5 No caso de estudos terapêuticos, este é o estudo controlado randomizado (ECT) e metanálises de ECTs. Os ETRs têm dentro deles, pela natureza da randomização, uma capacidade de ajudar a controlar o viés.6,7 O viés (do qual existem muitos tipos) pode confundir o resultado de um estudo de tal forma que o estudo pode sobre ou subestimar qual é o verdadeiro efeito do tratamento.8 A randomização é capaz de alcançar isso, não apenas controlando as variáveis prognósticas conhecidas, mas também, e mais importante, controlando as variáveis prognósticas desconhecidas dentro de uma população de amostra.7 Ou seja, o ato da randomização deve ser capaz de criar uma distribuição igual das variáveis prognósticas (conhecidas e desconhecidas) dentro dos grupos de controle e tratamento dentro de um estudo. Essa medida de controle de viés ajuda a obter uma estimativa mais precisa da verdade.6 Esses estudos de natureza mais observacional têm dentro de seus desenhos áreas de viés não presentes no estudo randomizado.
Análises de estudos controlados aleatorizados em efeito usam os dados de TCRs individuais e os agrupam estatisticamente.5,9 Isso efetivamente aumenta o número de pacientes dos quais os dados foram obtidos, aumentando assim o tamanho efetivo da amostra. O maior inconveniente desse agrupamento é que ele depende da qualidade dos ETRs que foram utilizados.9 Por exemplo, se três ETRs são a favor de um tratamento e duas não são ou se os resultados mostram grande variação entre as estimativas do efeito do tratamento com grandes intervalos de confiança (ou seja, a precisão da estimativa pontual do efeito do tratamento é pobre) entre diferentes ETRs, então há alguma variável (ou variáveis) causando resultados inconsistentes entre os estudos (uma variável pode ser de fato diferenças na qualidade do estudo entre outras) e a qualidade dos resultados utilizáveis do agrupamento estatístico será pobre. Entretanto, se cinco ETRs metodologicamente bem feitos forem utilizados, todos favorecendo um tratamento e tendo medidas precisas do efeito do tratamento (ou seja, intervalos de confiança estreitos), então os dados obtidos do agrupamento estatístico são muito mais acreditáveis. Os primeiros estudos podem ser denominados heterogêneos e os segundos homogêneos.9
Em contraste, o nível mais baixo na hierarquia (além da opinião dos especialistas) é o relato de caso e a série de casos.3 Estes são geralmente de natureza retrospectiva e não têm grupo de comparação. Eles são capazes de fornecer resultados para apenas um subgrupo da população (aqueles com a intervenção). Existe o potencial para a introdução de viés, especialmente se houver uma coleta incompleta de dados ou um acompanhamento que pode acontecer com desenhos de estudo retrospectivos. Além disso, estes estudos são geralmente baseados na experiência de um único cirurgião ou centro, o que pode levantar dúvidas quanto à generalização dos resultados. Mesmo com estes inconvenientes, este desenho de estudo pode ser útil de muitas maneiras. Eles podem ser usados eficazmente para a geração de hipóteses, bem como para fornecer informações sobre entidades de doenças raras ou complicações que possam estar associadas a certos procedimentos ou implantes. Por exemplo, o relato de taxas de infecção após uma grande série de fraturas da tíbia tratadas com uma unha intramedular remame10 ou a taxa de falha de hardware de um determinado implante, para citar alguns.
O próximo nível de estudo é o controle de caso. O caso-controle começa com um grupo que teve um resultado de interesse e olha para outros indivíduos semelhantes para ver que fatores podem ter estado presentes no grupo de estudo e podem estar associados com o resultado. Vejamos um exemplo hipotético. Aqueles pacientes que têm uma pseudartrose após uma fratura da tíbia tratada com uma unha intramedular. Se quiséssemos ver quais fatores prognósticos podem ter contribuído para isso, um grupo que fosse compatível com as variáveis prognósticas conhecidas, como idade, tipo de tratamento, padrão de fratura, etc., poderia então ser comparado e uma análise de outras variáveis prognósticas, como tabagismo, uso antiinflamatório não esteróide ou padrão de fratura poderia ser feita para ver se havia alguma associação entre elas e o desenvolvimento da pseudartrose. O inconveniente deste desenho é que pode haver fatores de risco desconhecidos ou ainda não identificados que não seriam passíveis de análise. No entanto, naqueles que são conhecidos, a força da associação pode ser determinada e dada sob a forma de odds ratios ou, por vezes, riscos relativos. Outros pontos fortes do desenho deste estudo são que geralmente são menos dispendiosos de implementar e podem permitir uma “resposta” mais rápida a uma questão específica. Eles também podem permitir a análise de múltiplos fatores prognósticos e relações dentro desses fatores para ajudar a determinar potenciais associações ao resultado da escolha (neste caso, não união).
Em contraste com o caso-controle e ligeiramente superior nos níveis de hierarquia de evidência,3 o estudo de coorte é geralmente feito de forma prospectiva (embora possa ser feito retrospectivamente) e geralmente segue dois grupos de pacientes. Um desses grupos tem um fator de risco ou fator prognóstico de interesse e o outro não. Os grupos são seguidos para ver qual é a taxa de desenvolvimento de uma doença ou resultado específico naqueles com factor de risco em comparação com aqueles sem factor de risco. Dado que isto é geralmente feito de forma prospectiva, ele se enquadra mais na hierarquia, uma vez que a coleta de dados e o acompanhamento podem ser monitorados mais de perto e podem ser feitas tentativas para torná-los tão completos e precisos quanto possível. Este tipo de desenho de estudo pode ser muito poderoso em alguns casos. Por exemplo, se alguém quisesse ver qual era o efeito do fumo nas taxas não sindicais, não seria ético ou geralmente possível randomizar pacientes com fraturas naqueles que vão fumar e naqueles que não vão. Entretanto, ao seguir dois grupos de pacientes, fumantes e não fumantes com fraturas da tíbia, por exemplo, pode-se então documentar as taxas de não sindicalização entre os dois grupos. Neste caso, devido ao seu desenho prospectivo, os grupos podem, pelo menos, ser combinados para tentar limitar o viés de pelo menos aquelas variáveis prognósticas que são conhecidas, como idade, padrão de fratura ou tipo de tratamento para citar algumas.
É importante entender as distinções entre os desenhos de estudo. Alguns investigadores argumentam que estudos observacionais bem construídos levam a conclusões semelhantes às dos TCR.11 Entretanto, outros sugerem que estudos observacionais têm um potencial mais significativo para superestimar ou subestimar os efeitos do tratamento. De fato, exemplos estão presentes tanto em especialidades médicas quanto ortopédicas cirúrgicas mostrando que resultados discrepantes podem ser encontrados entre estudos randomizados e não randomizados.6,8,12 Um exemplo recente não cirúrgico disso é a terapia de reposição hormonal em mulheres na pós-menopausa.13,14 Estudos observacionais anteriores sugeriram que havia um efeito significativo da terapia de reposição hormonal na densidade óssea com um perfil de risco favorável. Entretanto, um grande TCR recente encontrou uma incidência crescente de eventos cardíacos prejudiciais e outros eventos adversos nas pessoas submetidas à terapia de reposição hormonal, riscos que até então tinham sido subestimados por estudos observacionais.13,14 Como resultado disso, o tratamento da osteoporose pós-menopausa passou por uma mudança na terapia de primeira linha.13 Na literatura ortopédica tem sido sugerido que, ao avaliar ensaios randomizados e não randomizados utilizando estudos de artroplastia versus fixação interna, estudos não randomizados superestimaram o risco de mortalidade após artroplastia e subestimaram o risco de cirurgia de revisão com artroplastia.8 Curiosamente, eles também descobriram que naqueles estudos não randomizados que tiveram resultados similares aos estudos randomizados, a idade do paciente, gênero e deslocamento da fratura foram controlados para os grupos.8 Isto ilustra a importância do controle tanto para as variáveis quanto para a randomização que controlará variáveis potencialmente importantes, mas ainda desconhecidas.
Assim, o tipo de desenho de estudo utilizado coloca o estudo amplamente em uma hierarquia de evidências desde a série de casos até o estudo controlado randomizado. Existe também, contudo, uma hierarquia interna dentro dos níveis gerais de evidência e que é geralmente baseada na metodologia do estudo e na qualidade geral.