Heterogeneidade em meta-análise (I²)
Toda meta-análise enfrenta a mesma pergunta logo depois de combinar os estudos: os resultados são consistentes o suficiente para serem agrupados? Essa é a questão da heterogeneidade — e ela define se o número final (o efeito combinado) representa de fato a literatura ou se esconde diferenças importantes. O indicador mais citado nesse contexto é o I², mas ele é, ao mesmo tempo, o mais mal interpretado. Entender o que ele mede (e o que não mede) é o que separa uma meta-análise sólida de uma frágil.
O que é heterogeneidade
Quando reunimos vários estudos sobre a mesma pergunta, é natural que seus resultados não sejam idênticos. Parte dessa variação é apenas acaso (erro amostral): cada estudo é uma amostra, e amostras flutuam. A heterogeneidade é a variação que vai além do acaso — ou seja, diferenças reais nos efeitos que os estudos estão estimando.
É útil separar três fontes:
- Heterogeneidade clínica: diferenças nos participantes (idade, gravidade, comorbidades), nas intervenções (doses, esquemas, tempo de seguimento) e nos desfechos medidos.
- Heterogeneidade metodológica: diferenças no desenho dos estudos e no risco de viés (cegamento, perdas de seguimento, forma de mensurar o desfecho).
- Heterogeneidade estatística: a consequência mensurável das duas anteriores — a dispersão observada nas estimativas de efeito. É ela que o Q, o I² e o tau² tentam quantificar.
O ponto central: a heterogeneidade estatística é um sintoma. A pergunta interessante quase nunca é "qual o valor do I²?", e sim "por que esses estudos diferem?".
Como a heterogeneidade é medida
Três medidas costumam aparecer juntas nos relatórios, e cada uma responde a uma coisa diferente.
Q de Cochran
O Q é um teste estatístico que compara a dispersão observada entre os estudos com a que se esperaria apenas pelo acaso. Sua hipótese nula é "não há heterogeneidade". O problema é que o Q depende muito do número de estudos:
- Com poucos estudos, ele tem pouco poder — pode não rejeitar a nula mesmo havendo heterogeneidade real (um "não significativo" enganoso).
- Com muitos estudos, fica sensível demais — detecta heterogeneidades minúsculas e irrelevantes.
Por isso, decidir pela presença ou ausência de heterogeneidade apenas pelo p do Q é um erro clássico — o mesmo tipo de armadilha de quem interpreta só o valor de p isolado.
I²
O I², proposto por Higgins e Thompson (2002) e popularizado por Higgins e colaboradores (2003), foi criado justamente para contornar parte dessas limitações. Ele expressa, em porcentagem, a proporção da variabilidade total entre os estudos que se deve à heterogeneidade verdadeira, e não ao erro amostral. Varia de 0% (toda a variação é acaso) a 100% (a variação é dominada por diferenças reais).
A grande vantagem do I² é não depender diretamente do número de estudos nem da escala da medida de efeito, o que facilita a comparação entre meta-análises. A referência aproximada mais usada é:
| I² | Interpretação orientativa |
|---|---|
| 0% – 40% | Pode não ser importante |
| 30% – 60% | Heterogeneidade moderada |
| 50% – 90% | Heterogeneidade substancial |
| 75% – 100% | Heterogeneidade considerável |
Repare que as faixas se sobrepõem de propósito: os autores que criaram o índice sempre o trataram como um guia, não como uma régua com cortes rígidos. Dizer "I² > 50%, logo a meta-análise é inválida" é uma simplificação incorreta.
Tau² (τ²)
O tau² estima a variância entre os estudos — ou seja, o tamanho real da dispersão dos efeitos verdadeiros, na escala da própria medida (log do risco relativo, diferença de médias etc.). Diferente do I², que é relativo (uma proporção), o tau² é absoluto e tem interpretação direta na construção do intervalo de predição, do qual falaremos adiante. Em muitas situações, ele é mais informativo do que o I² para entender o impacto prático da heterogeneidade.
A Evidens cuida da estratégia de busca, extração, modelo estatístico, forest/funnel plots e análises de heterogeneidade — você continua único autor do trabalho.
Solicitar orçamento
O limite mais importante do I²
Há uma confusão que vale desfazer com clareza: o I² não mede a quantidade absoluta de heterogeneidade. Ele mede a proporção da variação total que é atribuível a ela. Isso tem uma consequência contraintuitiva: o I² depende da precisão dos estudos.
- Em estudos grandes e precisos, o erro amostral é pequeno; então mesmo uma heterogeneidade modesta domina a variação total e o I² fica alto.
- Em estudos pequenos e imprecisos, o erro amostral é grande; ele "dilui" a heterogeneidade real e o I² fica baixo, ainda que os efeitos verdadeiros sejam bem diferentes entre si.
Ou seja: duas meta-análises podem ter o mesmo tau² (mesma dispersão real dos efeitos) e I² completamente diferentes, só por causa do tamanho dos estudos. Por isso, nunca interprete o I² isoladamente. Olhe sempre o tau², o intervalo de predição e, principalmente, o forest plot.
Efeito fixo ou efeito aleatório?
A heterogeneidade conversa diretamente com a escolha do modelo de combinação, e aqui mora outro mal-entendido comum: a ideia de que se deve "escolher o modelo pelo I²".
- O modelo de efeito fixo assume que existe um único efeito verdadeiro, comum a todos os estudos, e que as diferenças observadas são só acaso. Faz sentido quando os estudos são muito semelhantes (mesma população, mesmo protocolo).
- O modelo de efeitos aleatórios assume que existe uma distribuição de efeitos verdadeiros — cada estudo estima um efeito ligeiramente diferente, e queremos a média dessa distribuição. É o pressuposto mais realista na maioria das sínteses clínicas, em que populações e protocolos variam.
A decisão deve ser conceitual e pré-especificada, baseada na pergunta e no pressuposto sobre os efeitos, e não definida depois de ver o I². Vale lembrar ainda que, sob heterogeneidade, o modelo de efeitos aleatórios produz intervalos de confiança mais largos (mais honestos quanto à incerteza) e redistribui os pesos, dando relativamente mais peso aos estudos menores — o que tem implicações que merecem atenção.
O intervalo de predição: o número que falta na maioria dos relatórios
O efeito combinado e seu intervalo de confiança respondem "qual é o efeito médio e com que precisão o estimamos?". Mas, quando há heterogeneidade, uma pergunta mais útil para a prática é: "em um novo cenário, que efeito eu posso esperar?". Quem responde a isso é o intervalo de predição, calculado a partir do tau².
Ele indica a faixa em que provavelmente cairá o efeito verdadeiro de um futuro estudo. Não é raro uma meta-análise mostrar um intervalo de confiança estreito e favorável e, ao mesmo tempo, um intervalo de predição tão amplo que cruza a linha de "nenhum efeito" — sinal de que, apesar da média positiva, o efeito pode não se repetir em alguns contextos. Por isso, em meta-análises de efeitos aleatórios, relatar o intervalo de predição é cada vez mais recomendado.
O que fazer diante de heterogeneidade alta
Heterogeneidade alta não é um defeito a ser "consertado" mexendo no número — é uma informação a ser investigada. As estratégias adequadas são:
- Análise de subgrupos pré-especificada: separe os estudos por características plausíveis (tipo de população, dose, risco de viés) e veja se o efeito difere entre os grupos. Pré-especificar evita o garimpo de subgrupos "convenientes".
- Meta-regressão: quando há estudos suficientes, modela-se a relação entre uma característica dos estudos (covariável) e o tamanho do efeito. Exige cautela: poucos estudos por covariável levam a achados instáveis e ao risco de falsos positivos.
- Análise de sensibilidade: reanalise removendo estudos com alto risco de viés ou outliers, e verifique se a conclusão se mantém. Robustez é um bom sinal.
- Reconsiderar o agrupamento: se os estudos são clinicamente incompatíveis, talvez a resposta certa seja não combinar e fazer uma síntese estruturada/narrativa. Um número combinado de estudos que não deveriam ser somados é pior do que nenhum número.
Em todos os casos, distinga sempre a heterogeneidade que você explica (com subgrupos e meta-regressão) da que permanece (residual). É a heterogeneidade não explicada que mais exige humildade na conclusão.
Como reportar (boas práticas)
- Apresente Q (com p), I² e tau² em conjunto — nunca apenas um deles.
- Inclua o intervalo de predição em meta-análises de efeitos aleatórios.
- Mostre o forest plot e descreva o que ele revela (sobreposição dos intervalos, outliers, direção dos efeitos).
- Justifique a escolha do modelo pela pergunta, não pelo I².
- Descreva subgrupos e meta-regressões como pré-especificados ou exploratórios, com transparência.
- Siga o checklist PRISMA para o relato completo da revisão.
Se você está nas etapas anteriores da síntese — desenho, escopo e tamanho da evidência —, vale ver primeiro a página geral sobre meta-análise e o roteiro de qual teste estatístico usar nas análises primárias.
Perguntas frequentes
O que é heterogeneidade em uma meta-análise?
É a variação real entre os resultados dos estudos, além da esperada pelo acaso. Pode ser clínica (populações, doses, desfechos), metodológica (desenhos e vieses) ou estatística — esta última quantificada por Q, I² e tau².
O que o I² mede exatamente?
A proporção da variabilidade total entre os estudos que se deve à heterogeneidade verdadeira, e não ao acaso. Vai de 0% a 100%; em torno de 25%, 50% e 75% indica heterogeneidade baixa, moderada e alta — como guia, não como corte rígido.
Por que não confiar só no p do teste Q?
Porque o Q tem pouco poder com poucos estudos e fica sensível demais com muitos. Avalie em conjunto com I², tau² e o forest plot.
Efeito fixo ou aleatório?
Decida pela pergunta e pelo pressuposto, não pelo I². O efeito fixo assume um único efeito verdadeiro; o aleatório, uma distribuição de efeitos — geralmente o mais realista em estudos clínicos diversos.
O que fazer quando a heterogeneidade é alta?
Investigar, não "corrigir": subgrupos e meta-regressão pré-especificados, análises de sensibilidade e, se os estudos forem incompatíveis, considerar não agrupar. Sempre reporte tau² e intervalo de predição.
A Evidens faz busca, extração, modelo estatístico, figuras e análises de heterogeneidade — você continua único autor.
Solicitar orçamento