Herausforderung: Alles Zusammenführen
In dieser Herausforderung wenden Sie alles an, was Sie im Verlauf des Kurses gelernt haben, von der Datenvorverarbeitung bis hin zum Trainieren und Bewerten des Modells.





Aufgabe
Swipe to start coding
- Zielvariable codieren.
- Die Daten so aufteilen, dass 33% für den Testdatensatz und der Rest für den Trainingsdatensatz verwendet werden.
- Einen
ColumnTransformer
erstellen, um nur die Spalten'island'
und'sex'
zu kodieren. Die anderen Spalten bleiben unverändert. Einen geeigneten Encoder für nominale Daten verwenden. - Die Lücken in einem
param_grid
ausfüllen, um folgende Werte für die Anzahl der Nachbarn zu testen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Ein
GridSearchCV
-Objekt mit demKNeighborsClassifier
als Modell erstellen. - Eine Pipeline konstruieren, die mit
ct
als erstem Schritt beginnt, gefolgt von Imputation mit dem häufigsten Wert, Standardisierung und abschließendGridSearchCV
als letztem Schätzer. - Das Modell mit einer Pipeline auf dem Trainingsdatensatz trainieren.
- Das Modell auf dem Testdatensatz evaluieren. (Score ausgeben)
- Eine Vorhersage für die Zielvariable für
X_test
erhalten. - Den besten durch
grid_search
gefundenen Schätzer ausgeben.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 4. Kapitel 10
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.13
Herausforderung: Alles Zusammenführen
Swipe um das Menü anzuzeigen
In dieser Herausforderung wenden Sie alles an, was Sie im Verlauf des Kurses gelernt haben, von der Datenvorverarbeitung bis hin zum Trainieren und Bewerten des Modells.





Aufgabe
Swipe to start coding
- Zielvariable codieren.
- Die Daten so aufteilen, dass 33% für den Testdatensatz und der Rest für den Trainingsdatensatz verwendet werden.
- Einen
ColumnTransformer
erstellen, um nur die Spalten'island'
und'sex'
zu kodieren. Die anderen Spalten bleiben unverändert. Einen geeigneten Encoder für nominale Daten verwenden. - Die Lücken in einem
param_grid
ausfüllen, um folgende Werte für die Anzahl der Nachbarn zu testen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Ein
GridSearchCV
-Objekt mit demKNeighborsClassifier
als Modell erstellen. - Eine Pipeline konstruieren, die mit
ct
als erstem Schritt beginnt, gefolgt von Imputation mit dem häufigsten Wert, Standardisierung und abschließendGridSearchCV
als letztem Schätzer. - Das Modell mit einer Pipeline auf dem Trainingsdatensatz trainieren.
- Das Modell auf dem Testdatensatz evaluieren. (Score ausgeben)
- Eine Vorhersage für die Zielvariable für
X_test
erhalten. - Den besten durch
grid_search
gefundenen Schätzer ausgeben.
Lösung
War alles klar?
Danke für Ihr Feedback!
Awesome!
Completion rate improved to 3.13Abschnitt 4. Kapitel 10
single