O que é AUC estatística?

Perguntado por: lagostinho9 . Última atualização: 20 de maio de 2023
4.6 / 5 14 votos

A AUC é o resultado da integração de todos os pontos durante o trajeto da curva, e computa simultaneamente a sensibilidade e a especificidade, sendo um estimador do comportamento da acurácia global do teste 15. Receiver operating characteristic (ROC) methodology: the state of the art.

A Área sob a curva ROC (AUC) é uma outra forma de medir o desempenho do modelo de previsão. Ela calcula a área sob a curva da característica de operação do receptor (Receiver Operating Characteristic, ROC). O AUC está ligado ao poder preditivo (PP) de acordo com a seguinte fórmula: PP = 2 * AUC - 1.

Em resumo, quanto maior o valor do ROC AUC, melhor o modelo está ranqueando exemplos positivos acima dos negativos. Ele costuma variar de 0,5 (significa que o modelo não tem qualquer poder preditivo) a 1,0 (significa que o modelo prevê as classes perfeitamente).

A área sob a curva representa a exposição total do organismo a uma substância ativa e ajuda a avaliar e a comparar os perfis de biodisponibilidade entre medicamentos.

A analise ROC (Receiver Operating Characteristic) é uma ferramenta poderosa para medir e especificar problemas no desempenho do diagnóstico em medicina. Esta análise por meio de um método gráfico simples e robusto, permite estudar a variação da sensibilidade e especificidade, para diferentes valores de corte.

Acurácia é uma métrica de avaliação muito popular para descobrir a performance de um modelo de machine learning em uma tarefa de classificação. Costumo pensar nela como “taxa de acerto” do modelo. Ela é calculada dividindo o número de previsões corretas pelo número total de previsões.

Uma curva ROC é um gráfico de linha que plota a probabilidde de um resultado positivo verdadeiro – ou a sensibilidade do teste – versus a probalidade de um resultado falso positivo para uma série de diferentes pontos de coorte.

Especificidade (Specificity): a proporção de casos negativos que foram identificados corretamente. De forma semelhante a sensibilidade, calculamos a especificidade assim: 40/50 = 0,8; Acurácia (Accuracy): a proporção de casos que foram corretamente previstos, sejam eles verdadeiro positivo ou verdadeiro negativo.

A Acurácia é a média global do acerto do modelo ao classificar as classes, pode ser calculada através da razão (VN+VP)/(VP+FN+VN+FP).

Carboplatina – Cálculo de dose AUC (Fórmula de Calvert)
AUC alvo representa a área sob a curva desejada. . A função renal pode ver-se alterada durante a quimioterapia. O cálculo deve ser repetido de cada dose de carboplatina.

Dose total (mg) = (AUC estabelecida) x (TFG + 25).

A área total sob uma curva de distribuição normal padrão é de 100% (ou seja, "1" como um decimal). Por exemplo, a metade esquerda da curva é 50% ou 0,5. Portanto, a probabilidade de uma variável aleatória aparecer na metade esquerda da curva é 0,5.

Curvas de Nível (I)
A curva de nível de uma função z=f(x,y) é definida como sendo a projeção no plano xy da interseção do plano z=k com o gráfico de f e, portanto, sua equação é f(x,y)=c.

Passo-a-passo para calcular a área entre duas curvas:
Passo 1: Esboce a região cuja área deseja determinar. Anote as equações de cada curva os pontos de intersecção entre elas. Passo 2: Analise se é mais conveniente utilizar retângulos verticais de largura dx ou horizontais de largura dy e desenhe-o no esboço.

Acurácia: é a probabilidade do teste fornecer resultados corretos, ou seja, ser positivo nos doentes e negativo nos não doentes.

Valor preditivo positivo (VPP): é a probabilidade de um indivíduo avaliado e com resultado positivo ser realmente doente. Valor preditivo negativo (VPN): é a probabilidade de um indivíduo avaliado e com resultado negativo ser realmente normal.

Pontuação F1 (pontuação macro F1)
A pontuação F1 é derivada dos Recall valores Precision e. Ele mede a precisão geral do classificador. A pontuação mais alta é 1 e a pontuação mais baixa é 0.

A acurácia basicamente faz o cálculo de todos os acertos (VP e VN) divididos por todos os acertos mais os erros (FP e FN), como é colocado na Equação 1. Porém, quando há uma classe muito desbalanceada, a acurácia não é uma boa métrica a ser usada.

Por isso esta métrica também é conhecida como taxa de detecção: de todos os exemplos que o modelo poderia detectar, quantos ele realmente conseguiu. No nosso exemplo numérico: se tínhamos 100 pessoas com a doença nos dados de avaliação e modelo identificou 60 delas corretamente, o recall é 60/100 = 60%.

A sensibilidade de um teste diagnóstico corresponde ao percentual de resultados positivos dentre as pessoas que tem uma determinada doença ou condição clínica. A especificidade é a capacidade do mesmo teste ser negativo nos indivíduos que não apresentam a doença que está sendo investigada.