Herausforderung: Implementierung eines Entscheidungsbaums
In dieser Aufgabe wird das Titanic-Datenset verwendet, das Informationen über Passagiere der Titanic enthält, darunter Alter, Geschlecht, Familiengröße und mehr. Ziel ist es, vorherzusagen, ob ein Passagier überlebt hat oder nicht.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Für die Implementierung des Entscheidungsbaums kann der DecisionTreeClassifier aus sklearn verwendet werden:
Konstruktor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— maximale Tiefe des Baums. Standardwert ist None;min_samples_leaf— minimale Anzahl von Instanzen in einem Blattknoten. Standardwert ist 1;
Methoden:
fit(X, y)— Trainingsdatensatz anpassen;predict(X)— Klasse für X vorhersagen;score(X, y)— Gibt die Genauigkeit für das X, y-Set zurück;
Attribute:
feature_importances_— Merkmalswichtigkeiten;feature_names_in_— Merkmalsnamen, die während .fit() gesehen wurden.
Die Aufgabe besteht darin, einen Entscheidungsbaum zu erstellen und mittels Grid Search die optimalen Werte für max_depth und min_samples_leaf zu bestimmen.
Swipe to start coding
Sie erhalten einen Titanic-Datensatz, der als DataFrame in der Variablen df gespeichert ist.
- Initialisierung eines Decision-Tree-Modells und Speicherung in der Variablen
decision_tree. - Erstellung eines Wörterbuchs für
GridSearchCV, um die Werte[1, 2, 3, 4, 5, 6, 7]fürmax_depthund[1, 2, 4, 6]fürmin_samples_leafzu durchlaufen, und Speicherung in der Variablenparam_grid. - Initialisierung und Training eines
GridSearchCV-Objekts, Festlegung der Anzahl der Folds auf10und Speicherung des trainierten Modells in der Variablengrid_cv.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 3.33
Herausforderung: Implementierung eines Entscheidungsbaums
Swipe um das Menü anzuzeigen
In dieser Aufgabe wird das Titanic-Datenset verwendet, das Informationen über Passagiere der Titanic enthält, darunter Alter, Geschlecht, Familiengröße und mehr. Ziel ist es, vorherzusagen, ob ein Passagier überlebt hat oder nicht.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Für die Implementierung des Entscheidungsbaums kann der DecisionTreeClassifier aus sklearn verwendet werden:
Konstruktor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— maximale Tiefe des Baums. Standardwert ist None;min_samples_leaf— minimale Anzahl von Instanzen in einem Blattknoten. Standardwert ist 1;
Methoden:
fit(X, y)— Trainingsdatensatz anpassen;predict(X)— Klasse für X vorhersagen;score(X, y)— Gibt die Genauigkeit für das X, y-Set zurück;
Attribute:
feature_importances_— Merkmalswichtigkeiten;feature_names_in_— Merkmalsnamen, die während .fit() gesehen wurden.
Die Aufgabe besteht darin, einen Entscheidungsbaum zu erstellen und mittels Grid Search die optimalen Werte für max_depth und min_samples_leaf zu bestimmen.
Swipe to start coding
Sie erhalten einen Titanic-Datensatz, der als DataFrame in der Variablen df gespeichert ist.
- Initialisierung eines Decision-Tree-Modells und Speicherung in der Variablen
decision_tree. - Erstellung eines Wörterbuchs für
GridSearchCV, um die Werte[1, 2, 3, 4, 5, 6, 7]fürmax_depthund[1, 2, 4, 6]fürmin_samples_leafzu durchlaufen, und Speicherung in der Variablenparam_grid. - Initialisierung und Training eines
GridSearchCV-Objekts, Festlegung der Anzahl der Folds auf10und Speicherung des trainierten Modells in der Variablengrid_cv.
Lösung
Danke für Ihr Feedback!
single