single
Herausforderung: Implementierung eines Entscheidungsbaums
Swipe um das Menü anzuzeigen
In dieser Aufgabe verwendest du den Titanic-Datensatz, der Informationen über Passagiere der Titanic enthält, darunter Alter, Geschlecht, Familiengröße und mehr. Ziel ist es, vorherzusagen, ob ein Passagier überlebt hat oder nicht.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Für die Implementierung des Entscheidungsbaums kannst du den DecisionTreeClassifier aus sklearn verwenden:
Aufgabe: Aufbau eines Entscheidungsbaums und Bestimmung der optimalen Werte für max_depth und min_samples_leaf mittels Grid Search.
Wischen, um mit dem Codieren zu beginnen
Sie erhalten einen Titanic-Datensatz, der als DataFrame in der Variablen df gespeichert ist.
- Initialisieren Sie ein Decision Tree-Modell und speichern Sie es in der Variablen
decision_tree. - Erstellen Sie ein Dictionary für
GridSearchCV, um mit den Werten[1, 2, 3, 4, 5, 6, 7]fürmax_depthund[1, 2, 4, 6]fürmin_samples_leafzu iterieren, und speichern Sie es in der Variablenparam_grid. - Initialisieren und trainieren Sie ein
GridSearchCV-Objekt, setzen Sie die Anzahl der Folds auf10und speichern Sie das trainierte Modell in der Variablengrid_cv.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen