Glissez pour afficher le menu

Prérequis

La classification est une tâche d'apprentissage supervisé dont l'objectif est de prédire la classe d'une instance à partir de ses caractéristiques. Le modèle apprend à partir d'exemples étiquetés dans un ensemble d'entraînement puis attribue une classe à de nouvelles données non vues.

La régression prédit une valeur numérique continue (par exemple, le prix), qui peut prendre de nombreuses valeurs possibles. La classification prédit une valeur catégorielle (par exemple, le type de sucrerie), en choisissant une option parmi un ensemble limité de classes.

Il existe plusieurs types de classification :

Classification binaire : la cible possède deux résultats possibles (spam/pas spam, cookie/pas cookie) ;
Classification multi-classes : trois catégories ou plus sont possibles (spam/important/publicité/autre ; cookie/guimauve/bonbon) ;
Classification multi-étiquettes : une instance peut appartenir à plusieurs classes simultanément (un film peut être action et comédie ; un e-mail peut être important et professionnel).

Pour la plupart des modèles d'apprentissage automatique, il est nécessaire d'encoder la cible sous forme numérique. Pour la classification binaire, les résultats sont généralement encodés en 0/1 (par exemple, 1 - cookie, 0 - non-cookie). Pour une classification multiclasse, les résultats sont généralement encodés en 0, 1, 2, ... (par exemple, 0 - candy, 1 - cookie, 2 - marshmallow).

De nombreux modèles différents peuvent effectuer une classification. Quelques exemples incluent :

k-plus proches voisins ;
régression logistique ;
arbre de décision ;
forêt aléatoire.

Heureusement, ils sont tous implémentés dans la bibliothèque scikit-learn et sont faciles à utiliser.

Remarque

Aucun modèle d'apprentissage automatique n'est supérieur à un autre. Les performances optimales d'un modèle dépendent de la tâche spécifique.

Tout était clair ?

Merci pour vos commentaires !

Section 1. Chapitre 1

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Qu'est-ce que la classification