La curva ROC es una representación gráfica de la relación entre las tasas de falso positivo y verdadero positivo. Una forma estándar de evaluar la relación es con el área debajo de la curva, que se muestra debajo del gráfico en el informe.  Las curvas ROC se utilizan con frecuencia para mostrar de forma gráfica la conexión / compensación entre la sensibilidad clínica y la especificidad para cada posible corte de una prueba o una combinación de pruebas. Además, el área debajo de la curva ROC da una idea del beneficio de utilizar las pruebas en cuestión.

El término ROC significa Característica de funcionamiento del receptor. La investigación inicial fue motivada por el deseo de determinar cómo los "operadores de receptores" del RADAR de EE.UU. habían pasado por alto el avión japonés. Ahora, las curvas ROC se utilizan con frecuencia para mostrar la conexión entre la sensibilidad clínica y la especificidad para cada posible corte de una prueba o una combinación de pruebas. Además, el área debajo de la curva ROC da una idea del beneficio de utilizar las pruebas en cuestión.

¿Qué son las curvas ROC?

Una herramienta útil para predecir la probabilidad de un resultado binario son la curva de características operativas del receptor, o curvas ROC.

Es un gráfico de la tasa de falsos positivos (eje x) frente a la tasa de verdaderos positivos (eje y) para varios valores de umbral candidatos diferentes entre 0,0 y 1,0. Dicho de otra manera, traza la tasa de falsas alarmas frente a la tasa de aciertos.

Definiciones Estándar

Dos definiciones estándar utilizadas en esta área son las siguientes:

  • Sensibilidad, la probabilidad de que un valor x dado (una prueba o medida) prediga correctamente una condición existente. Para una x dada, la probabilidad de predecir incorrectamente la existencia de una condición es 1 - sensibilidad.
  • Especificidad, la probabilidad de que una prueba prediga correctamente que una condición no existe.

Una curva ROC es un gráfico de sensibilidad por (1 - especificidad) para cada valor de x. El área bajo la curva ROC es un índice común que se utiliza para resumir la información contenida en la curva.

Cuando realiza una regresión logística simple con un resultado binario, existe una opción de plataforma para solicitar una curva ROC para ese análisis. Después de seleccionar la opción Curva ROC, debe especificar qué nivel usar como respuesta positiva.

Si una prueba pronosticara perfectamente, tendría un valor por encima del cual caería toda la población anormal y por debajo del cual caerían todos los valores normales. Sería perfectamente sensible y luego pasaría por el punto (0,1) de la cuadrícula. Cuanto más se acerque la curva ROC a este punto ideal, mejor será su capacidad de discriminación. Una prueba sin capacidad predictiva produce una curva que sigue la diagonal de la cuadrícula.

Tasa de verdaderos positivos y falsos positivos

La tasa de verdaderos positivos se calcula como el número de verdaderos positivos dividido por la suma del número de verdaderos positivos y el número de falsos negativos. Describe qué tan bueno es el modelo para predecir la clase positiva cuando el resultado real es positivo.

Tasa de verdaderos positivos = verdaderos positivos / (verdaderos positivos + falsos negativos)

Sensibilidad = verdaderos positivos / (verdaderos positivos + falsos negativos)

La tasa de falsos positivos se calcula como el número de falsos positivos dividido por la suma del número de falsos positivos y el número de verdaderos negativos.

También se denomina tasa de falsas alarmas, ya que resume la frecuencia con la que se predice una clase positiva cuando el resultado real es negativo.

Tasa de falsos positivos = falsos positivos / (falsos positivos + verdaderos negativos)

La tasa de falsos positivos también se conoce como la especificidad invertida, donde la especificidad es el número total de verdaderos negativos dividido por la suma del número de verdaderos negativos y falsos positivos.

Especificidad

Especificidad = verdaderos negativos / (verdaderos negativos + falsos positivos)

Dónde:

Tasa de falsos positivos = 1 - Especificidad

La curva ROC es una herramienta útil por varias razones:

Las curvas de diferentes modelos se pueden comparar directamente en general o para diferentes umbrales.

El área bajo la curva (AUC) se puede utilizar como resumen de la habilidad del modelo.

La forma de la curva contiene mucha información, incluido lo que más nos podría interesar por un problema, la tasa de falsos positivos esperada y la tasa de falsos negativos.

Utilidad de las Curvas ROC

Es especialmente útil para evaluar modelos predictivos u otras pruebas que producen valores de salida en un rango continuo, ya que captura la compensación entre sensibilidad y especificidad en ese rango. Hay muchas formas de realizar un análisis ROC. Las curvas ROC se utilizan en bioquímica clínica para elegir el punto de corte más apropiado para una prueba. El mejor punto de corte tiene la tasa de verdaderos positivos más alta junto con la tasa de falsos positivos más baja. Como el área bajo una curva ROC es una medida de la utilidad de una prueba en general, donde un área mayor significa una prueba más útil, las áreas bajo las curvas ROC se utilizan para comparar la utilidad de las pruebas.

Explicación de los valores de las Curvas ROC

Para dejar esto en claro:

Los valores más pequeños en el eje x del gráfico indican menos falsos positivos y más negativos verdaderos.

Los valores más grandes en el eje y del gráfico indican mayores verdaderos positivos y menores falsos negativos.

Cuando predecimos un resultado binario, es una predicción correcta (verdadero positivo) o no (falso positivo). Existe una tensión entre estas opciones, lo mismo con verdadero negativo y falso negativo.

Esto es lo que queremos decir cuando decimos que el modelo tiene habilidad. Generalmente, los modelos hábiles están representados por curvas que se inclinan hacia la parte superior izquierda de la trama.

Clasificadores sin habilidad

Un clasificador sin habilidad es aquel que no puede discriminar entre las clases y predeciría una clase aleatoria o una clase constante en todos los casos. Un modelo sin habilidad se representa en el punto (0.5, 0.5).  Por lo tanto, un modelo sin habilidad en cada umbral está representado por una línea diagonal desde la parte inferior izquierda del gráfico hasta la parte superior derecha y tiene un AUC de 0.5.

Un modelo con habilidad perfecta se representa en un punto (0,1). Un modelo con habilidad perfecta está representado por una línea que viaja desde la parte inferior izquierda de la trama hasta la parte superior izquierda y luego a través de la parte superior derecha.

Un operador puede trazar la curva ROC para el modelo final y elegir un umbral que proporcione un equilibrio deseable entre los falsos positivos y los falsos negativos.

Cómo hacer una Curva ROC

Para hacer una curva ROC, debe estar familiarizado con los conceptos de verdadero positivo, verdadero negativo, falso positivo y falso negativo. Estos conceptos se utilizan cuando se comparan los resultados de una prueba con la verdad clínica, que se establece mediante el uso de procedimientos de diagnóstico que no involucran la prueba en cuestión.

Error de Medición

Predicción de probabilidades

En un problema de clasificación, podemos decidir predecir los valores de clase directamente.

Alternativamente, puede ser más flexible predecir las probabilidades para cada clase. La razón de esto es proporcionar la capacidad de elegir e incluso calibrar el umbral de cómo interpretar las probabilidades predichas.

Por ejemplo, un valor predeterminado podría ser usar un umbral de 0.5, lo que significa que una probabilidad en [0.0, 0.49] es un resultado negativo (0) y una probabilidad en [0.5, 1.0] es un resultado positivo.

Este umbral se puede ajustar para ajustar el comportamiento del modelo a un problema específico. Un ejemplo sería reducir más de uno u otro tipo de error.

Al hacer una predicción para un problema de clasificación binario o de dos clases, existen dos tipos de errores que podríamos cometer.

Falso positivo. Predecir un evento cuando no hubo ningún evento.

Falso negativo. No prediga ningún evento cuando en realidad hubo un evento.

Al predecir probabilidades y calibrar un umbral, el operador del modelo puede elegir un equilibrio de estas dos preocupaciones.

Una forma común de comparar modelos que predicen probabilidades para problemas de dos clases es usar una curva ROC.

Conclusiones

Suponga que tiene un valor de x que es una medida de diagnóstico y desea determinar un valor de umbral de x que indique lo siguiente:

  • Existe una condición si el valor x es mayor que el umbral.
  • No existe una condición si el valor x es menor que el umbral.

Ahora considera una prueba de diagnóstico a medida que varía el umbral y, por lo tanto, causa más o menos falsos positivos y falsos negativos. Lo ideal es tener un rango muy estrecho de valores de criterio x que divida mejor los verdaderos negativos y verdaderos positivos. La curva de la característica de funcionamiento del receptor (ROC) muestra la rapidez con la que se produce esta transición. El objetivo de la curva ROC es tener diagnósticos que maximicen el área bajo la curva.

También te puede interesar: Metodología de la Investigación en la Universidad de Miami

Curvas ROC

Curvas ROC

 

 

Abrir chat
1
Bienvenido(a) a Online Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!