Regressão logística na prática
A regressão logística é o modelo mais usado na pesquisa em saúde quando o desfecho é "sim ou não": teve complicação ou não, sobreviveu ou não, respondeu ao tratamento ou não. Ela permite estimar o efeito de vários fatores ao mesmo tempo e — crucialmente — ajustar para confundidores. Veja quando usá-la, como ler os resultados e o que verificar antes de confiar no modelo.
Quando usar
Use regressão logística quando o desfecho é binário e você quer saber como uma ou mais variáveis (preditores) influenciam a chance desse desfecho. O grande valor está no ajuste: ao incluir vários preditores, o modelo estima o efeito de cada um mantendo os outros constantes. É assim que se separa, por exemplo, o efeito do tabagismo do efeito da idade quando os dois andam juntos.
Se o desfecho for contínuo, o modelo apropriado é a regressão linear; se for tempo até um evento, é o modelo de Cox.
O que o modelo entrega: o odds ratio ajustado
A regressão logística não estima risco diretamente — ela estima odds ratios (razões de chance). Na saída do software, o coeficiente B vem acompanhado de Exp(B), que é o odds ratio:
- OR > 1: a variável aumenta a chance do desfecho. Exemplo: OR = 2 indica o dobro da chance por unidade do preditor.
- OR < 1: a variável reduz a chance (efeito protetor). OR = 0,5 indica metade da chance.
- OR = 1: sem efeito.
O termo "ajustado" é o que dá força ao resultado: cada OR é estimado controlando as demais variáveis do modelo. Por isso o OR ajustado pode diferir bastante do OR bruto (não ajustado) — a diferença entre eles é justamente o efeito da confusão.
Atenção a um erro muito comum: como o modelo produz odds ratios, interpretá-los como risco relativo exagera a associação quando o desfecho é frequente. Esse ponto é detalhado no informativo sobre odds ratio vs. risco relativo.
A Evidens faz desenho, cálculo amostral, análise e figuras — você continua único autor.
Solicitar orçamento
Quantas variáveis o seu n comporta
Um erro frequente em TCCs e dissertações é incluir variáveis demais para uma amostra pequena. O que limita o modelo não é o n total, e sim o número de eventos do desfecho menos frequente. Uma regra prática amplamente usada sugere limitar o número de preditores a aproximadamente um para cada dez eventos. Com 30 desfechos, por exemplo, três variáveis é um teto razoável. Ultrapassar isso produz estimativas instáveis, intervalos de confiança enormes e risco de overfitting — um modelo que se ajusta ao acaso dos seus dados e não se reproduz.
Pressupostos a verificar
A regressão logística é robusta, mas não é livre de pressupostos:
- Independência das observações — cada linha é um indivíduo independente; medidas repetidas exigem modelos específicos.
- Ausência de multicolinearidade — preditores muito correlacionados entre si desestabilizam os coeficientes.
- Linearidade no logit — para variáveis contínuas, a relação com o log das chances deve ser aproximadamente linear; caso contrário, transforme ou categorize com critério.
- Tamanho amostral adequado — eventos suficientes por variável, como descrito acima.
Vale ainda avaliar a qualidade do ajuste (calibração) e a capacidade discriminativa do modelo — em geral pela área sob a curva ROC —, além de checar observações influentes. E lembre que o ajuste só controla os confundidores medidos: variáveis não mensuradas permanecem fora do modelo.
Como reportar
Apresente os odds ratios ajustados com seus intervalos de confiança de 95% e os valores de p, deixando claro quais variáveis entraram no modelo e por quê. Descreva como os preditores foram selecionados — seleção orientada por hipótese é preferível a seleção automática cega. Diretrizes de relato como o checklist STROBE pedem que o método de modelagem, as variáveis de ajuste e o tratamento de dados faltantes sejam descritos com transparência.
Perguntas frequentes
Quando usar regressão logística?
Quando o desfecho é binário e você quer estimar o efeito de variáveis sobre a chance desse desfecho, ajustando para confundidores.
Como interpretar o odds ratio ajustado?
Exp(B) indica quanto a chance muda por unidade da variável, mantendo as demais constantes. Maior que 1 aumenta; menor que 1 reduz; igual a 1, sem efeito.
Quantas variáveis posso incluir?
Depende do número de eventos, não do n total. Uma regra prática é cerca de uma variável por dez eventos.
Quais pressupostos verificar?
Independência, ausência de multicolinearidade, linearidade no logit para contínuas e tamanho amostral adequado.
A Evidens faz desenho, cálculo amostral, análise e figuras — você continua único autor.
Solicitar orçamento