Contenu du cours
Classification Avec Python
Classification Avec Python
Défi : Implémenter un Arbre de Décision
Dans ce défi, vous utiliserez le jeu de données titanic. Il contient des informations sur les passagers du Titanic, y compris leur âge, sexe, taille de la famille, etc. Et la tâche consiste à prédire si une personne a survécu ou non.
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Pour implémenter l'arbre de décision, vous pouvez utiliser le DecisionTreeClassifier
de sklearn
.
Votre tâche consiste à construire un arbre de décision et à trouver le meilleur max_depth
et min_samples_leaf
en utilisant la recherche par grille.
Swipe to start coding
- Importez la classe
DecisionTreeClassifier
desklearn.tree
. - Assignez une instance de
DecisionTreeClassifier
à la variabledecision_tree
. - Créez un dictionnaire pour un
GridSearchCV
pour parcourir les valeurs[1, 2, 3, 4, 5, 6, 7]
demax_depth
et les valeurs[1, 2, 4, 6]
demin_samples_leaf
. - Créez un objet
GridSearchCV
et entraînez-le.
Solution
Merci pour vos commentaires !
Défi : Implémenter un Arbre de Décision
Dans ce défi, vous utiliserez le jeu de données titanic. Il contient des informations sur les passagers du Titanic, y compris leur âge, sexe, taille de la famille, etc. Et la tâche consiste à prédire si une personne a survécu ou non.
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Pour implémenter l'arbre de décision, vous pouvez utiliser le DecisionTreeClassifier
de sklearn
.
Votre tâche consiste à construire un arbre de décision et à trouver le meilleur max_depth
et min_samples_leaf
en utilisant la recherche par grille.
Swipe to start coding
- Importez la classe
DecisionTreeClassifier
desklearn.tree
. - Assignez une instance de
DecisionTreeClassifier
à la variabledecision_tree
. - Créez un dictionnaire pour un
GridSearchCV
pour parcourir les valeurs[1, 2, 3, 4, 5, 6, 7]
demax_depth
et les valeurs[1, 2, 4, 6]
demin_samples_leaf
. - Créez un objet
GridSearchCV
et entraînez-le.
Solution
Merci pour vos commentaires !