Abschnitt 4. Kapitel 10
single
Herausforderung: Alles Zusammenführen
Swipe um das Menü anzuzeigen
In dieser Herausforderung wird der vollständige im Kurs erlernte Workflow angewendet – von der Datenvorverarbeitung über das Training bis hin zur Modellevaluierung.
Aufgabe
Wischen, um mit dem Codieren zu beginnen
Sie arbeiten mit einem Pinguin-Datensatz. Erstellen Sie eine ML-Pipeline zur Klassifizierung der Arten mit KNN, einschließlich Kodierung, Umgang mit fehlenden Werten, Skalierung und Tuning.
- Kodieren von
ymitLabelEncoder. - Aufteilen mit
train_test_split(test_size=0.33). - Erstellen von
ct:OneHotEncoderauf'island','sex',remainder='passthrough'. - Festlegen von
param_gridfürn_neighbors,weights,p. Fürn_neighborssollten vorzugsweise ungerade Ganzzahlen verwendet werden. - Erstellen von
GridSearchCV(KNeighborsClassifier(), param_grid). - Pipeline:
ct→SimpleImputer('most_frequent')→StandardScaler→GridSearchCV. - Training auf den Trainingsdaten.
- Ausgabe des
.scoreauf dem Testdatensatz. - Vorhersage, Ausgabe der ersten 5 dekodierten Labels.
- Ausgabe von
.best_estimator_.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 4. Kapitel 10
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen