Curva ROC e área sob a curva (AUC): como interpretar
Quando um exame produz um valor contínuo — um marcador laboratorial, um escore de risco, a saída de um modelo — e você quer saber o quanto ele separa doentes de não doentes, a ferramenta é a curva ROC e seu resumo, a área sob a curva (AUC). É um dos gráficos mais pedidos em projetos de teste diagnóstico, e interpretá-lo bem evita conclusões exageradas sobre a "acurácia" de um marcador.
De onde vem a curva
Todo ponto de corte aplicado a um teste contínuo gera uma tabela 2×2 e, dela, duas medidas:
- Sensibilidade — a proporção de doentes corretamente identificados (verdadeiros positivos).
- Especificidade — a proporção de não doentes corretamente classificados (verdadeiros negativos).
A curva ROC nasce de variar o ponto de corte por toda a faixa de valores e marcar, para cada um, a sensibilidade (eixo y) contra a taxa de falsos positivos, ou seja, 1 − especificidade (eixo x). Cada ponto da curva é um corte possível. A diagonal representa um teste sem poder de discriminação — equivalente a jogar uma moeda.
O que a AUC mede
A área sob a curva resume a ROC inteira em um único número entre 0 e 1. Sua interpretação mais precisa: a AUC é a probabilidade de o teste atribuir um valor mais alto a um doente escolhido ao acaso do que a um não doente também escolhido ao acaso. Ela mede a capacidade de discriminação — ordenar corretamente doentes acima de sadios.
- 0,5 — nenhuma discriminação (acaso).
- 0,7 a 0,8 — discriminação aceitável.
- 0,8 a 0,9 — boa.
- acima de 0,9 — excelente.
Esses limiares são convenções de orientação, não regras absolutas — o que conta como "bom" depende do que o teste vai decidir na prática. E, como toda estimativa, a AUC deve vir com intervalo de confiança de 95%: uma AUC de 0,82 com IC de 0,62 a 0,95 numa amostra pequena diz bem menos do que parece.
A Evidens calcula sensibilidade, especificidade, AUC com IC, ponto de corte ótimo e gera a curva ROC pronta para o artigo — você continua único autor.
Solicitar orçamento
AUC não depende da prevalência — valores preditivos sim
Uma propriedade importante: a curva ROC e a AUC não variam com a prevalência da doença, porque sensibilidade e especificidade são calculadas dentro de cada grupo (doentes e não doentes). Isso as torna úteis para comparar testes. Mas atenção: o que o clínico realmente quer saber — "dado um resultado positivo, qual a chance de o paciente ter a doença?" — é o valor preditivo, e esse depende da prevalência. Uma AUC alta não garante bom valor preditivo positivo em uma população de baixa prevalência.
Escolhendo o ponto de corte
A AUC avalia o teste como um todo; para usá-lo, é preciso fixar um ponto de corte. Não existe corte universalmente "melhor": subir a sensibilidade custa especificidade e vice-versa. O índice de Youden (sensibilidade + especificidade − 1) identifica o ponto que maximiza a soma das duas, mas a decisão deve pesar o custo clínico de cada erro. Para rastrear uma doença grave e tratável, prioriza-se sensibilidade (não perder casos); para confirmar antes de uma intervenção arriscada, prioriza-se especificidade. A mesma 2×2 que gera a ROC é a base do teste qui-quadrado de associação entre categóricas.
O que reportar
Em estudos de acurácia diagnóstica, diretrizes de relato como o checklist STARD pedem: o padrão-ouro de referência, sensibilidade e especificidade no corte escolhido (com intervalos de confiança), a AUC com seu IC, como o ponto de corte foi definido e se ele foi pré-especificado ou derivado dos próprios dados. Cortes "otimizados" no mesmo conjunto em que são testados tendem a parecer melhores do que serão em dados novos — por isso a validação importa.
Perguntas frequentes
O que significa a área sob a curva (AUC)?
É a probabilidade de o teste dar um valor maior a um doente do que a um não doente, ambos escolhidos ao acaso. 0,5 é o acaso; 1,0, a discriminação perfeita.
Qual é um bom valor de AUC?
Como referência: ~0,5 não discrimina, 0,7–0,8 aceitável, 0,8–0,9 boa, acima de 0,9 excelente. São convenções; o que importa depende do contexto.
A AUC depende da prevalência?
Não. A AUC mede discriminação e independe da prevalência. Os valores preditivos é que dependem dela.
Como escolher o melhor ponto de corte?
Não há corte universal. O índice de Youden maximiza sensibilidade + especificidade, mas a escolha deve pesar o custo de falsos positivos e negativos.
A Evidens faz desenho, análise e figuras — você continua único autor.
Solicitar