Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Alles Zusammenführen | Modellierung
ML-Einführung Mit Scikit-Learn

bookHerausforderung: Alles Zusammenführen

In dieser Herausforderung wenden Sie alles an, was Sie im Verlauf des Kurses gelernt haben, von der Datenvorverarbeitung bis hin zum Trainieren und Bewerten des Modells.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Aufgabe

Swipe to start coding

  1. Zielvariable codieren.
  2. Die Daten so aufteilen, dass 33% für den Testdatensatz und der Rest für den Trainingsdatensatz verwendet werden.
  3. Einen ColumnTransformer erstellen, um nur die Spalten 'island' und 'sex' zu kodieren. Die anderen Spalten bleiben unverändert. Einen geeigneten Encoder für nominale Daten verwenden.
  4. Die Lücken in einem param_grid ausfüllen, um folgende Werte für die Anzahl der Nachbarn zu testen: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Ein GridSearchCV-Objekt mit dem KNeighborsClassifier als Modell erstellen.
  6. Eine Pipeline konstruieren, die mit ct als erstem Schritt beginnt, gefolgt von Imputation mit dem häufigsten Wert, Standardisierung und abschließend GridSearchCV als letztem Schätzer.
  7. Das Modell mit einer Pipeline auf dem Trainingsdatensatz trainieren.
  8. Das Modell auf dem Testdatensatz evaluieren. (Score ausgeben)
  9. Eine Vorhersage für die Zielvariable für X_test erhalten.
  10. Den besten durch grid_search gefundenen Schätzer ausgeben.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 10
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.13

bookHerausforderung: Alles Zusammenführen

Swipe um das Menü anzuzeigen

In dieser Herausforderung wenden Sie alles an, was Sie im Verlauf des Kurses gelernt haben, von der Datenvorverarbeitung bis hin zum Trainieren und Bewerten des Modells.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Aufgabe

Swipe to start coding

  1. Zielvariable codieren.
  2. Die Daten so aufteilen, dass 33% für den Testdatensatz und der Rest für den Trainingsdatensatz verwendet werden.
  3. Einen ColumnTransformer erstellen, um nur die Spalten 'island' und 'sex' zu kodieren. Die anderen Spalten bleiben unverändert. Einen geeigneten Encoder für nominale Daten verwenden.
  4. Die Lücken in einem param_grid ausfüllen, um folgende Werte für die Anzahl der Nachbarn zu testen: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Ein GridSearchCV-Objekt mit dem KNeighborsClassifier als Modell erstellen.
  6. Eine Pipeline konstruieren, die mit ct als erstem Schritt beginnt, gefolgt von Imputation mit dem häufigsten Wert, Standardisierung und abschließend GridSearchCV als letztem Schätzer.
  7. Das Modell mit einer Pipeline auf dem Trainingsdatensatz trainieren.
  8. Das Modell auf dem Testdatensatz evaluieren. (Score ausgeben)
  9. Eine Vorhersage für die Zielvariable für X_test erhalten.
  10. Den besten durch grid_search gefundenen Schätzer ausgeben.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

close

Awesome!

Completion rate improved to 3.13
Abschnitt 4. Kapitel 10
single

single

some-alt