Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Qu'est-ce que la Classification | Classificateur k-NN
Classification avec Python

bookQu'est-ce que la Classification

La classification est une tâche d'apprentissage supervisé. Son objectif est de prédire la classe à laquelle appartient une instance à partir d'un ensemble de paramètres (caractéristiques). Il est nécessaire de fournir de nombreux exemples de données étiquetées (appelés ensemble d'entraînement) pour que l'ordinateur puisse apprendre avant de prédire la classe d'une nouvelle instance.

La différence entre la classification et la régression est que la régression prédit une valeur numérique continue, par exemple, un prix. Cela peut être n'importe quel nombre réel (seulement positif pour un prix).

En revanche, la classification prédit une valeur catégorielle, par exemple, le type d'une confiserie. Il existe un ensemble fini de valeurs, et le modèle tente de classer chaque instance dans l'une de ces catégories.

Selon la formulation d’un problème, il existe plusieurs types de classification :

  • Classification binaire : dans la classification binaire, la cible correspond à l’une des deux issues possibles. Par exemple, email : spam/pas spam, sucrerie : cookie/pas cookie ;

  • Classification multi-classes : dans la classification multi-classes, il existe trois issues possibles ou plus pour une cible. Par exemple, email : spam/important/publicité/autre, sucrerie : cookie/guimauve/bonbon ;

  • Classification multi-étiquettes : dans la classification multi-étiquettes, chaque instance peut appartenir à plusieurs classes en même temps. Par exemple, un film peut être classé à la fois comme action et comédie, ou un email peut être marqué à la fois comme important et professionnel.

Pour la plupart des modèles d’apprentissage automatique, il est nécessaire d’encoder la cible sous forme numérique. Pour la classification binaire, les issues sont généralement encodées en 0/1 (par exemple, 1 - cookie, 0 - pas cookie). Pour la classification multi-classes, les issues sont généralement encodées en 0, 1, 2, ... (par exemple, 0 - candy, 1 - cookie, 2 - marshmallow).

De nombreux modèles différents peuvent effectuer une classification. Quelques exemples :

  • k-plus proches voisins ;
  • régression logistique ;
  • arbre de décision ;
  • forêt aléatoire.

Heureusement, ils sont tous implémentés dans la bibliothèque scikit-learn et sont faciles à utiliser.

Note
Note

Aucun modèle d'apprentissage automatique n'est supérieur à un autre. Les performances optimales d'un modèle dépendent de la tâche spécifique.

question mark

Quel est l'objectif principal de la classification en apprentissage automatique ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 1

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4.17

bookQu'est-ce que la Classification

Glissez pour afficher le menu

La classification est une tâche d'apprentissage supervisé. Son objectif est de prédire la classe à laquelle appartient une instance à partir d'un ensemble de paramètres (caractéristiques). Il est nécessaire de fournir de nombreux exemples de données étiquetées (appelés ensemble d'entraînement) pour que l'ordinateur puisse apprendre avant de prédire la classe d'une nouvelle instance.

La différence entre la classification et la régression est que la régression prédit une valeur numérique continue, par exemple, un prix. Cela peut être n'importe quel nombre réel (seulement positif pour un prix).

En revanche, la classification prédit une valeur catégorielle, par exemple, le type d'une confiserie. Il existe un ensemble fini de valeurs, et le modèle tente de classer chaque instance dans l'une de ces catégories.

Selon la formulation d’un problème, il existe plusieurs types de classification :

  • Classification binaire : dans la classification binaire, la cible correspond à l’une des deux issues possibles. Par exemple, email : spam/pas spam, sucrerie : cookie/pas cookie ;

  • Classification multi-classes : dans la classification multi-classes, il existe trois issues possibles ou plus pour une cible. Par exemple, email : spam/important/publicité/autre, sucrerie : cookie/guimauve/bonbon ;

  • Classification multi-étiquettes : dans la classification multi-étiquettes, chaque instance peut appartenir à plusieurs classes en même temps. Par exemple, un film peut être classé à la fois comme action et comédie, ou un email peut être marqué à la fois comme important et professionnel.

Pour la plupart des modèles d’apprentissage automatique, il est nécessaire d’encoder la cible sous forme numérique. Pour la classification binaire, les issues sont généralement encodées en 0/1 (par exemple, 1 - cookie, 0 - pas cookie). Pour la classification multi-classes, les issues sont généralement encodées en 0, 1, 2, ... (par exemple, 0 - candy, 1 - cookie, 2 - marshmallow).

De nombreux modèles différents peuvent effectuer une classification. Quelques exemples :

  • k-plus proches voisins ;
  • régression logistique ;
  • arbre de décision ;
  • forêt aléatoire.

Heureusement, ils sont tous implémentés dans la bibliothèque scikit-learn et sont faciles à utiliser.

Note
Note

Aucun modèle d'apprentissage automatique n'est supérieur à un autre. Les performances optimales d'un modèle dépendent de la tâche spécifique.

question mark

Quel est l'objectif principal de la classification en apprentissage automatique ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 1
some-alt