Qu'est-ce que la Classification
La classification est une tâche d'apprentissage supervisé dont l'objectif est de prédire la classe d'une instance à partir de ses caractéristiques. Le modèle apprend à partir d'exemples étiquetés dans un ensemble d'entraînement puis attribue une classe à de nouvelles données non vues.
La régression prédit une valeur numérique continue (par exemple, un prix), qui peut prendre de nombreuses valeurs possibles. La classification prédit une valeur catégorielle (par exemple, type de bonbon), en choisissant une option parmi un ensemble limité de classes.
Il existe plusieurs types de classification :
- Classification binaire : la cible possède deux issues possibles (spam/pas spam, cookie/pas cookie) ;
- Classification multi-classes : trois catégories ou plus sont possibles (spam/important/publicité/autre ; cookie/guimauve/bonbon) ;
- Classification multi-étiquettes : une instance peut appartenir à plusieurs classes simultanément (un film peut être action et comédie ; un e-mail peut être important et professionnel).
Pour la plupart des modèles d'apprentissage automatique, il est nécessaire d'encoder la cible sous forme numérique. Pour la classification binaire, les résultats sont généralement encodés en 0/1 (par exemple, 1 - cookie, 0 - pas cookie). Pour une classification multi-classes, les résultats sont généralement encodés en 0, 1, 2, ... (par exemple, 0 - candy, 1 - cookie, 2 - marshmallow).
De nombreux modèles différents peuvent effectuer une classification. Quelques exemples incluent :
- k-plus proches voisins ;
- régression logistique ;
- arbre de décision ;
- forêt aléatoire.
Heureusement, ils sont tous implémentés dans la bibliothèque scikit-learn et sont faciles à utiliser.
Aucun modèle d'apprentissage automatique n'est supérieur à un autre. Le modèle qui offrira les meilleures performances dépend de la tâche spécifique.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain the difference between binary, multi-class, and multi-label classification in more detail?
What are some common use cases for classification and regression?
How do I choose which classification model to use for my data?
Awesome!
Completion rate improved to 4.17
Qu'est-ce que la Classification
Glissez pour afficher le menu
La classification est une tâche d'apprentissage supervisé dont l'objectif est de prédire la classe d'une instance à partir de ses caractéristiques. Le modèle apprend à partir d'exemples étiquetés dans un ensemble d'entraînement puis attribue une classe à de nouvelles données non vues.
La régression prédit une valeur numérique continue (par exemple, un prix), qui peut prendre de nombreuses valeurs possibles. La classification prédit une valeur catégorielle (par exemple, type de bonbon), en choisissant une option parmi un ensemble limité de classes.
Il existe plusieurs types de classification :
- Classification binaire : la cible possède deux issues possibles (spam/pas spam, cookie/pas cookie) ;
- Classification multi-classes : trois catégories ou plus sont possibles (spam/important/publicité/autre ; cookie/guimauve/bonbon) ;
- Classification multi-étiquettes : une instance peut appartenir à plusieurs classes simultanément (un film peut être action et comédie ; un e-mail peut être important et professionnel).
Pour la plupart des modèles d'apprentissage automatique, il est nécessaire d'encoder la cible sous forme numérique. Pour la classification binaire, les résultats sont généralement encodés en 0/1 (par exemple, 1 - cookie, 0 - pas cookie). Pour une classification multi-classes, les résultats sont généralement encodés en 0, 1, 2, ... (par exemple, 0 - candy, 1 - cookie, 2 - marshmallow).
De nombreux modèles différents peuvent effectuer une classification. Quelques exemples incluent :
- k-plus proches voisins ;
- régression logistique ;
- arbre de décision ;
- forêt aléatoire.
Heureusement, ils sont tous implémentés dans la bibliothèque scikit-learn et sont faciles à utiliser.
Aucun modèle d'apprentissage automatique n'est supérieur à un autre. Le modèle qui offrira les meilleures performances dépend de la tâche spécifique.
Merci pour vos commentaires !