Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Alles Zusammenführen | Modellierung
ML-Einführung Mit Scikit-Learn

bookHerausforderung: Alles Zusammenführen

In dieser Aufgabe wird der vollständige Workflow angewendet, der im Kurs vermittelt wurde – von der Datenvorverarbeitung über das Training bis hin zur Modellevaluierung.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Aufgabe

Swipe to start coding

Sie erhalten einen Datensatz mit Pinguinen. Ihr Ziel ist es, eine Machine-Learning-Pipeline zu erstellen, die Pinguinarten mithilfe eines K-Nearest Neighbors (KNN)-Modells klassifiziert und dabei die Kodierung, fehlende Werte und Parameteroptimierung korrekt behandelt.

  1. Kodierung der Zielvariable mit LabelEncoder.
  2. Aufteilen des Datensatzes in Trainings- und Testdaten mit test_size=0.33.
  3. Erstellung eines ColumnTransformer (ct), der ausschließlich die Spalten 'island' und 'sex' mit einem geeigneten Encoder für nominale Daten (OneHotEncoder) kodiert und die übrigen Spalten unverändert lässt.
  4. Definition eines Parametergrids (param_grid) mit folgenden Werten für n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Erstellung eines GridSearchCV-Objekts mit KNeighborsClassifier als Basismodell und param_grid als Parameter.
  6. Aufbau einer Pipeline bestehend aus:
  • dem ColumnTransformer (ct);
  • einem SimpleImputer (Strategie = 'most_frequent');
  • einem StandardScaler;
  • und dem GridSearchCV als letztem Schritt.
  1. Training der Pipeline mit den Trainingsdaten (X_train, y_train).
  2. Auswertung des Modells auf den Testdaten durch Ausgabe von .score(X_test, y_test).
  3. Vorhersage auf dem Testdatensatz und Ausgabe der ersten 5 dekodierten Vorhersagen mit label_enc.inverse_transform().
  4. Abschließend Ausgabe des besten Schätzers, der von GridSearchCV gefunden wurde.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 10
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.13

bookHerausforderung: Alles Zusammenführen

Swipe um das Menü anzuzeigen

In dieser Aufgabe wird der vollständige Workflow angewendet, der im Kurs vermittelt wurde – von der Datenvorverarbeitung über das Training bis hin zur Modellevaluierung.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Aufgabe

Swipe to start coding

Sie erhalten einen Datensatz mit Pinguinen. Ihr Ziel ist es, eine Machine-Learning-Pipeline zu erstellen, die Pinguinarten mithilfe eines K-Nearest Neighbors (KNN)-Modells klassifiziert und dabei die Kodierung, fehlende Werte und Parameteroptimierung korrekt behandelt.

  1. Kodierung der Zielvariable mit LabelEncoder.
  2. Aufteilen des Datensatzes in Trainings- und Testdaten mit test_size=0.33.
  3. Erstellung eines ColumnTransformer (ct), der ausschließlich die Spalten 'island' und 'sex' mit einem geeigneten Encoder für nominale Daten (OneHotEncoder) kodiert und die übrigen Spalten unverändert lässt.
  4. Definition eines Parametergrids (param_grid) mit folgenden Werten für n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Erstellung eines GridSearchCV-Objekts mit KNeighborsClassifier als Basismodell und param_grid als Parameter.
  6. Aufbau einer Pipeline bestehend aus:
  • dem ColumnTransformer (ct);
  • einem SimpleImputer (Strategie = 'most_frequent');
  • einem StandardScaler;
  • und dem GridSearchCV als letztem Schritt.
  1. Training der Pipeline mit den Trainingsdaten (X_train, y_train).
  2. Auswertung des Modells auf den Testdaten durch Ausgabe von .score(X_test, y_test).
  3. Vorhersage auf dem Testdatensatz und Ausgabe der ersten 5 dekodierten Vorhersagen mit label_enc.inverse_transform().
  4. Abschließend Ausgabe des besten Schätzers, der von GridSearchCV gefunden wurde.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 10
single

single

some-alt