Aprende Qué es la Clasificación

Prerrequisitos

Clasificación es una tarea de aprendizaje supervisado cuyo objetivo es predecir la clase de una instancia utilizando sus características. El modelo aprende a partir de ejemplos etiquetados en un conjunto de entrenamiento y luego asigna una clase a nuevos datos no vistos.

La regresión predice un valor numérico continuo (por ejemplo, precio), que puede tomar muchos valores posibles. La clasificación predice un valor categórico (por ejemplo, tipo de dulce), eligiendo una opción de un conjunto limitado de clases.

Existen varios tipos de clasificación:

Clasificación binaria: el objetivo tiene dos posibles resultados (spam/no spam, galleta/no galleta);
Clasificación multiclase: tres o más categorías posibles (spam/importante/anuncio/otro; galleta/malvavisco/caramelo);
Clasificación multilabel: una instancia puede pertenecer a múltiples clases simultáneamente (una película puede ser de acción y comedia; un correo electrónico puede ser importante y relacionado con el trabajo).

Para la mayoría de los modelos de aprendizaje automático, es necesario codificar el objetivo como un número. Para la clasificación binaria, los resultados suelen codificarse como 0/1 (por ejemplo, 1 - cookie, 0 - not a cookie). Para una clasificación multiclase, los resultados suelen codificarse como 0, 1, 2, ... (por ejemplo, 0 - candy, 1 - cookie, 2 - marshmallow).

Muchos modelos diferentes pueden realizar clasificación. Algunos ejemplos incluyen:

k-Nearest Neighbors;
Regresión logística;
Árbol de decisión;
Bosque aleatorio.

Afortunadamente, todos están implementados en la biblioteca scikit-learn y son fáciles de utilizar.

Nota

Ningún modelo de aprendizaje automático es superior a otro. El modelo que tendrá el mejor desempeño depende de la tarea específica.

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 1. Capítulo 1

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Desliza para mostrar el menú