Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Vergleich von Modellen | Modelle Vergleichen
Klassifikation mit Python

bookHerausforderung: Vergleich von Modellen

Jetzt vergleichen Sie die bisher behandelten Modelle anhand eines einzelnen Datensatzes – dem Breast Cancer Dataset. Die Zielvariable ist die Spalte 'diagnosis', wobei 1 für maligne und 0 für benigne Fälle steht.

Sie wenden GridSearchCV auf jedes Modell an, um die besten Parameter zu finden. In dieser Aufgabe verwenden Sie Recall als Bewertungsmetrik, da das Minimieren von False Negatives entscheidend ist. Damit GridSearchCV die besten Parameter basierend auf dem Recall auswählt, setzen Sie scoring='recall'.

Aufgabe

Swipe to start coding

Es steht ein Brustkrebs-Datensatz zur Verfügung, der als DataFrame in der Variablen df gespeichert ist.

  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [3, 5, 7, 12] für n_neighbors durchläuft und in der Variablen knn_params speichert.
  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [0.1, 1, 10] für C durchläuft und in der Variablen lr_params speichert.
  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [2, 4, 6, 10] für max_depth und [1, 2, 4, 7] für min_samples_leaf durchläuft und in der Variablen dt_params speichert.
  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [2, 4, 6] für max_depth und [20, 50, 100] für n_estimators durchläuft und in der Variablen rf_params speichert.
  • Initialisierung und Training eines GridSearchCV-Objekts für jedes Modell und Speicherung der trainierten Modelle in den jeweiligen Variablen: knn_grid, lr_grid, dt_grid und rf_grid.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 4.17

bookHerausforderung: Vergleich von Modellen

Swipe um das Menü anzuzeigen

Jetzt vergleichen Sie die bisher behandelten Modelle anhand eines einzelnen Datensatzes – dem Breast Cancer Dataset. Die Zielvariable ist die Spalte 'diagnosis', wobei 1 für maligne und 0 für benigne Fälle steht.

Sie wenden GridSearchCV auf jedes Modell an, um die besten Parameter zu finden. In dieser Aufgabe verwenden Sie Recall als Bewertungsmetrik, da das Minimieren von False Negatives entscheidend ist. Damit GridSearchCV die besten Parameter basierend auf dem Recall auswählt, setzen Sie scoring='recall'.

Aufgabe

Swipe to start coding

Es steht ein Brustkrebs-Datensatz zur Verfügung, der als DataFrame in der Variablen df gespeichert ist.

  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [3, 5, 7, 12] für n_neighbors durchläuft und in der Variablen knn_params speichert.
  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [0.1, 1, 10] für C durchläuft und in der Variablen lr_params speichert.
  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [2, 4, 6, 10] für max_depth und [1, 2, 4, 7] für min_samples_leaf durchläuft und in der Variablen dt_params speichert.
  • Erstellung eines Wörterbuchs für GridSearchCV, das die Werte [2, 4, 6] für max_depth und [20, 50, 100] für n_estimators durchläuft und in der Variablen rf_params speichert.
  • Initialisierung und Training eines GridSearchCV-Objekts für jedes Modell und Speicherung der trainierten Modelle in den jeweiligen Variablen: knn_grid, lr_grid, dt_grid und rf_grid.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3
single

single

some-alt