Uitdaging: Implementatie van een Beslissingsboom
In deze uitdaging maak je gebruik van de Titanic-dataset, die informatie bevat over passagiers op de Titanic, waaronder hun leeftijd, geslacht, gezinsgrootte en meer. Het doel is om te voorspellen of een passagier heeft overleefd of niet.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Voor het implementeren van de Decision Tree kan gebruik worden gemaakt van de DecisionTreeClassifier uit sklearn:
Constructor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— maximale diepte van een boom. Standaardwaarde is None;min_samples_leaf— minimaal aantal instanties op een bladnode. Standaardwaarde is 1;
Methoden:
fit(X, y)— Trainingsset fitten;predict(X)— Klasse voorspellen voor X;score(X, y)— Geeft de nauwkeurigheid voor de X, y set terug;
Attributen:
feature_importances_— Kenmerkbelangrijkheden;feature_names_in_— Kenmerknamen gezien tijdens .fit().
De opdracht is het bouwen van een Decision Tree en het bepalen van de optimale max_depth en min_samples_leaf met behulp van grid search.
Swipe to start coding
Je krijgt een Titanic-dataset die is opgeslagen als een DataFrame in de variabele df.
- Initialiseer een Decision Tree-model en sla dit op in de variabele
decision_tree. - Maak een dictionary voor
GridSearchCVom te itereren over de waarden[1, 2, 3, 4, 5, 6, 7]voormax_depthen[1, 2, 4, 6]voormin_samples_leaf, en sla deze op in de variabeleparam_grid. - Initialiseer en train een
GridSearchCV-object, stel het aantal folds in op10, en sla het getrainde model op in de variabelegrid_cv.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 3.33
Uitdaging: Implementatie van een Beslissingsboom
Veeg om het menu te tonen
In deze uitdaging maak je gebruik van de Titanic-dataset, die informatie bevat over passagiers op de Titanic, waaronder hun leeftijd, geslacht, gezinsgrootte en meer. Het doel is om te voorspellen of een passagier heeft overleefd of niet.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Voor het implementeren van de Decision Tree kan gebruik worden gemaakt van de DecisionTreeClassifier uit sklearn:
Constructor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— maximale diepte van een boom. Standaardwaarde is None;min_samples_leaf— minimaal aantal instanties op een bladnode. Standaardwaarde is 1;
Methoden:
fit(X, y)— Trainingsset fitten;predict(X)— Klasse voorspellen voor X;score(X, y)— Geeft de nauwkeurigheid voor de X, y set terug;
Attributen:
feature_importances_— Kenmerkbelangrijkheden;feature_names_in_— Kenmerknamen gezien tijdens .fit().
De opdracht is het bouwen van een Decision Tree en het bepalen van de optimale max_depth en min_samples_leaf met behulp van grid search.
Swipe to start coding
Je krijgt een Titanic-dataset die is opgeslagen als een DataFrame in de variabele df.
- Initialiseer een Decision Tree-model en sla dit op in de variabele
decision_tree. - Maak een dictionary voor
GridSearchCVom te itereren over de waarden[1, 2, 3, 4, 5, 6, 7]voormax_depthen[1, 2, 4, 6]voormin_samples_leaf, en sla deze op in de variabeleparam_grid. - Initialiseer en train een
GridSearchCV-object, stel het aantal folds in op10, en sla het getrainde model op in de variabelegrid_cv.
Oplossing
Bedankt voor je feedback!
single