Herausforderung: Vergleich von Modellen
Jetzt vergleichen Sie die bisher behandelten Modelle anhand eines einzelnen Datensatzes – dem Breast Cancer Dataset. Die Zielvariable ist die Spalte 'diagnosis', wobei 1 für maligne und 0 für benigne Fälle steht.
Sie wenden GridSearchCV auf jedes Modell an, um die besten Parameter zu finden. In dieser Aufgabe verwenden Sie Recall als Bewertungsmetrik, da das Minimieren von False Negatives entscheidend ist. Damit GridSearchCV die besten Parameter basierend auf dem Recall auswählt, setzen Sie scoring='recall'.
Swipe to start coding
Es steht ein Brustkrebs-Datensatz zur Verfügung, der als DataFrame in der Variablen df gespeichert ist.
- Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[3, 5, 7, 12]fürn_neighborsdurchläuft und in der Variablenknn_paramsspeichert. - Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[0.1, 1, 10]fürCdurchläuft und in der Variablenlr_paramsspeichert. - Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[2, 4, 6, 10]fürmax_depthund[1, 2, 4, 7]fürmin_samples_leafdurchläuft und in der Variablendt_paramsspeichert. - Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[2, 4, 6]fürmax_depthund[20, 50, 100]fürn_estimatorsdurchläuft und in der Variablenrf_paramsspeichert. - Initialisierung und Training eines
GridSearchCV-Objekts für jedes Modell und Speicherung der trainierten Modelle in den jeweiligen Variablen:knn_grid,lr_grid,dt_gridundrf_grid.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4.17
Herausforderung: Vergleich von Modellen
Swipe um das Menü anzuzeigen
Jetzt vergleichen Sie die bisher behandelten Modelle anhand eines einzelnen Datensatzes – dem Breast Cancer Dataset. Die Zielvariable ist die Spalte 'diagnosis', wobei 1 für maligne und 0 für benigne Fälle steht.
Sie wenden GridSearchCV auf jedes Modell an, um die besten Parameter zu finden. In dieser Aufgabe verwenden Sie Recall als Bewertungsmetrik, da das Minimieren von False Negatives entscheidend ist. Damit GridSearchCV die besten Parameter basierend auf dem Recall auswählt, setzen Sie scoring='recall'.
Swipe to start coding
Es steht ein Brustkrebs-Datensatz zur Verfügung, der als DataFrame in der Variablen df gespeichert ist.
- Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[3, 5, 7, 12]fürn_neighborsdurchläuft und in der Variablenknn_paramsspeichert. - Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[0.1, 1, 10]fürCdurchläuft und in der Variablenlr_paramsspeichert. - Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[2, 4, 6, 10]fürmax_depthund[1, 2, 4, 7]fürmin_samples_leafdurchläuft und in der Variablendt_paramsspeichert. - Erstellung eines Wörterbuchs für
GridSearchCV, das die Werte[2, 4, 6]fürmax_depthund[20, 50, 100]fürn_estimatorsdurchläuft und in der Variablenrf_paramsspeichert. - Initialisierung und Training eines
GridSearchCV-Objekts für jedes Modell und Speicherung der trainierten Modelle in den jeweiligen Variablen:knn_grid,lr_grid,dt_gridundrf_grid.
Lösung
Danke für Ihr Feedback!
single