CONTENIDO - Rocio-Mejia/Github-Flow GitHub Wiki
¿Qué es?
Es un modelo que proporciona una manera de aprovechar la clasificación binaria. En un problema de clasificación dado con N soluciones posibles, una solución de uno frente a todos consiste en N clasificadores binarios independientes, es decir, un clasificador binario para cada resultado posible. Durante el entrenamiento, el modelo se ejecuta a través de una secuencia de clasificadores binarios, entrenando cada uno para responder una pregunta de clasificación independiente.
Ventajas
- Este enfoque es relativamente razonable cuando la cantidad total de clases es pequeña.
- Usado comúnmente para algoritmos que predicen naturalmente la probabilidad o puntaje de membresía de clase numérica
Desventajas
- Se vuelve cada vez más ineficiente a medida que aumenta la cantidad de clases.
- Requiere la creación de un modelo para cada clase.
- Con grandes conjuntos de datos, el modelo se vuelve lento(por ejemplo, redes neuronales) o con un gran número de clases (por ejemplo, cientos de clases).
Funcionamiento
-
Si el caso tiene n clases, One-Vs-All convierte su conjunto de datos de entrenamiento en n problemas de clasificación binaria.
-
Para cada clase i, se asignan entradas de cualquier otra clase al conjunto de datos negativo y asigna entradas con clase i al conjunto de datos positivo. El conjunto de datos ahora es un conjunto de datos binario. entrena un modelo, como la regresión logística para que se ajuste al conjunto de datos binarios. Este modelo determina la probabilidad de que una entrada dada pertenezca a la clase i (h (i) (x) = P (y = i), donde h (i) es el clasificador para la clase i).
Después de tener un modelo para cada clase/etiqueta, es hora de determinar a qué clase (si tiene un problema multiclase) o a qué clases (si tiene un problema multilabel) cada entrada pertenece a:
- Multiclase: elija la clase i, si h(i)(x) devuelve la mayor probabilidad de cada clasificador.
- Multilabel: para cada clase i, si h(i)(x) devuelve positivo, adjunte la clase i a esa entrada.
EJEMPLO
Dado un problema de clasificación de varias clases con ejemplos para cada clase "rojo", "azul" y "verde". Esto podría dividirse en tres conjuntos de datos de clasificación binaria de la siguiente manera:
- Problema de clasificación binaria 1: rojo vs [azul, verde]
- Problema de clasificación binaria 2: azul vs [rojo, verde]
- Problema de clasificación binaria 3: verde vs [rojo, azul]