Por que não devo confiar só no valor de p do teste Q?

O Q de Cochran tem pouco poder quando há poucos estudos (pode não detectar heterogeneidade real) e fica sensível demais quando há muitos estudos (acusa heterogeneidade trivial). Por isso, avalie em conjunto com o I², o tau² e a inspeção do forest plot.

Devo usar modelo de efeito fixo ou aleatório?

A escolha deve seguir a pergunta e o pressuposto, não o valor do I². O efeito fixo assume um único efeito verdadeiro comum a todos os estudos; o efeito aleatório assume uma distribuição de efeitos verdadeiros. Em síntese de estudos clínicos diversos, o modelo de efeitos aleatórios costuma ser o pressuposto mais realista.

Meta-análise

Heterogeneidade em meta-análise (I²)

Q: O que é heterogeneidade em uma meta-análise?

É a variação real entre os resultados dos estudos incluídos, além daquela esperada apenas pelo acaso. Pode ter origem clínica (populações, doses, desfechos diferentes), metodológica (desenhos e riscos de viés distintos) ou estatística, que é a que se quantifica com Q, I² e tau².

Q: O que o I² mede exatamente?

O I² estima a proporção da variabilidade total entre os estudos que se deve à heterogeneidade verdadeira, e não ao erro amostral. Vai de 0% a 100%. Como referência aproximada, valores em torno de 25%, 50% e 75% indicam heterogeneidade baixa, moderada e alta — mas são apenas orientações, não cortes rígidos.

Q: O que fazer quando a heterogeneidade é alta?

Não se trata de 'corrigir' um número. Explore as causas com análise de subgrupos e meta-regressão pré-especificadas, faça análises de sensibilidade e, se os estudos forem clinicamente incompatíveis, considere não agrupar e sintetizar de forma narrativa. Reporte sempre o tau² e o intervalo de predição.

Equipe Evidens · 18 de junho de 2026 · leitura de 9 min

Toda meta-análise enfrenta a mesma pergunta logo depois de combinar os estudos: os resultados são consistentes o suficiente para serem agrupados? Essa é a questão da heterogeneidade — e ela define se o número final (o efeito combinado) representa de fato a literatura ou se esconde diferenças importantes. O indicador mais citado nesse contexto é o I², mas ele é, ao mesmo tempo, o mais mal interpretado. Entender o que ele mede (e o que não mede) é o que separa uma meta-análise sólida de uma frágil.

O que é heterogeneidade

Quando reunimos vários estudos sobre a mesma pergunta, é natural que seus resultados não sejam idênticos. Parte dessa variação é apenas acaso (erro amostral): cada estudo é uma amostra, e amostras flutuam. A heterogeneidade é a variação que vai além do acaso — ou seja, diferenças reais nos efeitos que os estudos estão estimando.

É útil separar três fontes:

Heterogeneidade clínica: diferenças nos participantes (idade, gravidade, comorbidades), nas intervenções (doses, esquemas, tempo de seguimento) e nos desfechos medidos.
Heterogeneidade metodológica: diferenças no desenho dos estudos e no risco de viés (cegamento, perdas de seguimento, forma de mensurar o desfecho).
Heterogeneidade estatística: a consequência mensurável das duas anteriores — a dispersão observada nas estimativas de efeito. É ela que o Q, o I² e o tau² tentam quantificar.

O ponto central: a heterogeneidade estatística é um sintoma. A pergunta interessante quase nunca é "qual o valor do I²?", e sim "por que esses estudos diferem?".

Como a heterogeneidade é medida

Três medidas costumam aparecer juntas nos relatórios, e cada uma responde a uma coisa diferente.

Q de Cochran

O Q é um teste estatístico que compara a dispersão observada entre os estudos com a que se esperaria apenas pelo acaso. Sua hipótese nula é "não há heterogeneidade". O problema é que o Q depende muito do número de estudos:

Com poucos estudos, ele tem pouco poder — pode não rejeitar a nula mesmo havendo heterogeneidade real (um "não significativo" enganoso).
Com muitos estudos, fica sensível demais — detecta heterogeneidades minúsculas e irrelevantes.

Por isso, decidir pela presença ou ausência de heterogeneidade apenas pelo p do Q é um erro clássico — o mesmo tipo de armadilha de quem interpreta só o valor de p isolado.

I²

O I², proposto por Higgins e Thompson (2002) e popularizado por Higgins e colaboradores (2003), foi criado justamente para contornar parte dessas limitações. Ele expressa, em porcentagem, a proporção da variabilidade total entre os estudos que se deve à heterogeneidade verdadeira, e não ao erro amostral. Varia de 0% (toda a variação é acaso) a 100% (a variação é dominada por diferenças reais).

A grande vantagem do I² é não depender diretamente do número de estudos nem da escala da medida de efeito, o que facilita a comparação entre meta-análises. A referência aproximada mais usada é:

I²	Interpretação orientativa
0% – 40%	Pode não ser importante
30% – 60%	Heterogeneidade moderada
50% – 90%	Heterogeneidade substancial
75% – 100%	Heterogeneidade considerável

Repare que as faixas se sobrepõem de propósito: os autores que criaram o índice sempre o trataram como um guia, não como uma régua com cortes rígidos. Dizer "I² > 50%, logo a meta-análise é inválida" é uma simplificação incorreta.

Tau² (τ²)

O tau² estima a variância entre os estudos — ou seja, o tamanho real da dispersão dos efeitos verdadeiros, na escala da própria medida (log do risco relativo, diferença de médias etc.). Diferente do I², que é relativo (uma proporção), o tau² é absoluto e tem interpretação direta na construção do intervalo de predição, do qual falaremos adiante. Em muitas situações, ele é mais informativo do que o I² para entender o impacto prático da heterogeneidade.

Vai conduzir uma revisão sistemática com meta-análise?
A Evidens cuida da estratégia de busca, extração, modelo estatístico, forest/funnel plots e análises de heterogeneidade — você continua único autor do trabalho.
Solicitar orçamento

O limite mais importante do I²

Há uma confusão que vale desfazer com clareza: o I² não mede a quantidade absoluta de heterogeneidade. Ele mede a proporção da variação total que é atribuível a ela. Isso tem uma consequência contraintuitiva: o I² depende da precisão dos estudos.

Em estudos grandes e precisos, o erro amostral é pequeno; então mesmo uma heterogeneidade modesta domina a variação total e o I² fica alto.
Em estudos pequenos e imprecisos, o erro amostral é grande; ele "dilui" a heterogeneidade real e o I² fica baixo, ainda que os efeitos verdadeiros sejam bem diferentes entre si.

Ou seja: duas meta-análises podem ter o mesmo tau² (mesma dispersão real dos efeitos) e I² completamente diferentes, só por causa do tamanho dos estudos. Por isso, nunca interprete o I² isoladamente. Olhe sempre o tau², o intervalo de predição e, principalmente, o forest plot.

Efeito fixo ou efeito aleatório?

A heterogeneidade conversa diretamente com a escolha do modelo de combinação, e aqui mora outro mal-entendido comum: a ideia de que se deve "escolher o modelo pelo I²".

O modelo de efeito fixo assume que existe um único efeito verdadeiro, comum a todos os estudos, e que as diferenças observadas são só acaso. Faz sentido quando os estudos são muito semelhantes (mesma população, mesmo protocolo).
O modelo de efeitos aleatórios assume que existe uma distribuição de efeitos verdadeiros — cada estudo estima um efeito ligeiramente diferente, e queremos a média dessa distribuição. É o pressuposto mais realista na maioria das sínteses clínicas, em que populações e protocolos variam.

A decisão deve ser conceitual e pré-especificada, baseada na pergunta e no pressuposto sobre os efeitos, e não definida depois de ver o I². Vale lembrar ainda que, sob heterogeneidade, o modelo de efeitos aleatórios produz intervalos de confiança mais largos (mais honestos quanto à incerteza) e redistribui os pesos, dando relativamente mais peso aos estudos menores — o que tem implicações que merecem atenção.

O intervalo de predição: o número que falta na maioria dos relatórios

O efeito combinado e seu intervalo de confiança respondem "qual é o efeito médio e com que precisão o estimamos?". Mas, quando há heterogeneidade, uma pergunta mais útil para a prática é: "em um novo cenário, que efeito eu posso esperar?". Quem responde a isso é o intervalo de predição, calculado a partir do tau².

Ele indica a faixa em que provavelmente cairá o efeito verdadeiro de um futuro estudo. Não é raro uma meta-análise mostrar um intervalo de confiança estreito e favorável e, ao mesmo tempo, um intervalo de predição tão amplo que cruza a linha de "nenhum efeito" — sinal de que, apesar da média positiva, o efeito pode não se repetir em alguns contextos. Por isso, em meta-análises de efeitos aleatórios, relatar o intervalo de predição é cada vez mais recomendado.

O que fazer diante de heterogeneidade alta

Heterogeneidade alta não é um defeito a ser "consertado" mexendo no número — é uma informação a ser investigada. As estratégias adequadas são:

Análise de subgrupos pré-especificada: separe os estudos por características plausíveis (tipo de população, dose, risco de viés) e veja se o efeito difere entre os grupos. Pré-especificar evita o garimpo de subgrupos "convenientes".
Meta-regressão: quando há estudos suficientes, modela-se a relação entre uma característica dos estudos (covariável) e o tamanho do efeito. Exige cautela: poucos estudos por covariável levam a achados instáveis e ao risco de falsos positivos.
Análise de sensibilidade: reanalise removendo estudos com alto risco de viés ou outliers, e verifique se a conclusão se mantém. Robustez é um bom sinal.
Reconsiderar o agrupamento: se os estudos são clinicamente incompatíveis, talvez a resposta certa seja não combinar e fazer uma síntese estruturada/narrativa. Um número combinado de estudos que não deveriam ser somados é pior do que nenhum número.

Em todos os casos, distinga sempre a heterogeneidade que você explica (com subgrupos e meta-regressão) da que permanece (residual). É a heterogeneidade não explicada que mais exige humildade na conclusão.

Como reportar (boas práticas)

Apresente Q (com p), I² e tau² em conjunto — nunca apenas um deles.
Inclua o intervalo de predição em meta-análises de efeitos aleatórios.
Mostre o forest plot e descreva o que ele revela (sobreposição dos intervalos, outliers, direção dos efeitos).
Justifique a escolha do modelo pela pergunta, não pelo I².
Descreva subgrupos e meta-regressões como pré-especificados ou exploratórios, com transparência.
Siga o checklist PRISMA para o relato completo da revisão.

Se você está nas etapas anteriores da síntese — desenho, escopo e tamanho da evidência —, vale ver primeiro a página geral sobre meta-análise e o roteiro de qual teste estatístico usar nas análises primárias.

Perguntas frequentes

O que é heterogeneidade em uma meta-análise?

É a variação real entre os resultados dos estudos, além da esperada pelo acaso. Pode ser clínica (populações, doses, desfechos), metodológica (desenhos e vieses) ou estatística — esta última quantificada por Q, I² e tau².

O que o I² mede exatamente?

A proporção da variabilidade total entre os estudos que se deve à heterogeneidade verdadeira, e não ao acaso. Vai de 0% a 100%; em torno de 25%, 50% e 75% indica heterogeneidade baixa, moderada e alta — como guia, não como corte rígido.

Por que não confiar só no p do teste Q?

Porque o Q tem pouco poder com poucos estudos e fica sensível demais com muitos. Avalie em conjunto com I², tau² e o forest plot.

Efeito fixo ou aleatório?

Decida pela pergunta e pelo pressuposto, não pelo I². O efeito fixo assume um único efeito verdadeiro; o aleatório, uma distribuição de efeitos — geralmente o mais realista em estudos clínicos diversos.

O que fazer quando a heterogeneidade é alta?

Investigar, não "corrigir": subgrupos e meta-regressão pré-especificados, análises de sensibilidade e, se os estudos forem incompatíveis, considerar não agrupar. Sempre reporte tau² e intervalo de predição.

Precisa de ajuda com a meta-análise do seu estudo?
A Evidens faz busca, extração, modelo estatístico, figuras e análises de heterogeneidade — você continua único autor.
Solicitar orçamento

Equipe Evidens · publicado em 18 de junho de 2026 · Conheça nossos serviços