Qu'est-ce qu'un Arbre de Décision
Glissez pour afficher le menu
Pour de nombreux problèmes réels, il est possible de construire un arbre de décision. Dans un arbre de décision, une question est posée (nœud de décision) et, selon la réponse, on aboutit soit à une décision (nœud feuille), soit à d'autres questions (nœud de décision), et ainsi de suite.
Voici un exemple de test canard/pas canard :
L'application de la même logique aux données d'entraînement permet de dériver l'un des algorithmes d'apprentissage automatique les plus importants, utilisable pour les tâches de régression et de classification. Dans ce cours, l'accent sera mis sur la classification.
La vidéo suivante illustre le fonctionnement :
Dans la vidéo ci-dessus, « Classes » indique le nombre d'échantillons de données de chaque classe à un nœud. Par exemple, le nœud racine contient tous les échantillons de données (4 « cookies », 4 « not cookies »). Et le nœud feuille à gauche ne contient que 3 « not cookies ».
À chaque nœud de décision, l'objectif est de diviser les données d'entraînement afin que les points de données de chaque classe soient séparés dans leurs propres nœuds feuilles.
Un arbre de décision gère également la classification multiclasse avec facilité :
La classification avec plusieurs caractéristiques peut également être gérée par l'arbre de décision. Chaque nœud de décision peut alors diviser les données en utilisant n'importe laquelle des caractéristiques.
Dans la vidéo ci-dessus, l'ensemble d'entraînement est mis à l'échelle à l'aide de StandardScaler. Ce n'est pas nécessaire pour l'Arbre de Décision. Il fonctionnera tout aussi bien sur les données non mises à l'échelle. Cependant, la mise à l'échelle améliore les performances de tous les autres algorithmes, il est donc conseillé d'ajouter systématiquement cette étape à votre prétraitement.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion