Herausforderung: Modelle Vergleichen
Jetzt werden wir die Modelle, die wir an einem Datensatz gelernt haben, vergleichen. Dies ist ein Brustkrebs-Datensatz. Das Ziel ist die 'diagnosis'
-Spalte (1 – bösartig, 0 – gutartig).
Wir werden GridSearchCV
auf jedes Modell anwenden, um die besten Parameter zu finden. Außerdem verwenden wir in dieser Aufgabe die Recall-Metrik für die Bewertung, da wir keine False Negatives haben möchten. GridSearchCV
kann die Parameter basierend auf der Recall-Metrik auswählen, wenn Sie scoring='recall'
setzen.
Swipe to start coding
Die Aufgabe besteht darin, alle Modelle, die wir gelernt haben, zu erstellen und die besten Parameter zusammen mit dem besten Recall-Wert jedes Modells auszugeben. Sie müssen die Parameternamen in den param_grid
-Dictionaries ausfüllen.
- Für das k-NN-Modell finden Sie den besten
n_neighbors
-Wert aus[3, 5, 7, 12]
. - Für die logistische Regression durchlaufen Sie die Werte
[0.1, 1, 10]
vonC
. - Für einen Entscheidungsbaum möchten wir zwei Parameter konfigurieren,
max_depth
undmin_samples_leaf
. Durchlaufen Sie die Werte[2, 4, 6, 10]
fürmax_depth
und[1, 2, 4, 7]
fürmin_samples_leaf
. - Für einen Random Forest finden Sie den besten
max_depth
(maximale Tiefe jedes Baums) Wert aus[2, 4, 6]
und die beste Anzahl von Bäumen(n_estimators
). Versuchen Sie die Werte[20, 50, 100]
für die Anzahl der Bäume.
Lösung
Hinweis
Der Code benötigt einige Zeit zum Ausführen (weniger als eine Minute).
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.57
Herausforderung: Modelle Vergleichen
Swipe um das Menü anzuzeigen
Jetzt werden wir die Modelle, die wir an einem Datensatz gelernt haben, vergleichen. Dies ist ein Brustkrebs-Datensatz. Das Ziel ist die 'diagnosis'
-Spalte (1 – bösartig, 0 – gutartig).
Wir werden GridSearchCV
auf jedes Modell anwenden, um die besten Parameter zu finden. Außerdem verwenden wir in dieser Aufgabe die Recall-Metrik für die Bewertung, da wir keine False Negatives haben möchten. GridSearchCV
kann die Parameter basierend auf der Recall-Metrik auswählen, wenn Sie scoring='recall'
setzen.
Swipe to start coding
Die Aufgabe besteht darin, alle Modelle, die wir gelernt haben, zu erstellen und die besten Parameter zusammen mit dem besten Recall-Wert jedes Modells auszugeben. Sie müssen die Parameternamen in den param_grid
-Dictionaries ausfüllen.
- Für das k-NN-Modell finden Sie den besten
n_neighbors
-Wert aus[3, 5, 7, 12]
. - Für die logistische Regression durchlaufen Sie die Werte
[0.1, 1, 10]
vonC
. - Für einen Entscheidungsbaum möchten wir zwei Parameter konfigurieren,
max_depth
undmin_samples_leaf
. Durchlaufen Sie die Werte[2, 4, 6, 10]
fürmax_depth
und[1, 2, 4, 7]
fürmin_samples_leaf
. - Für einen Random Forest finden Sie den besten
max_depth
(maximale Tiefe jedes Baums) Wert aus[2, 4, 6]
und die beste Anzahl von Bäumen(n_estimators
). Versuchen Sie die Werte[20, 50, 100]
für die Anzahl der Bäume.
Lösung
Hinweis
Der Code benötigt einige Zeit zum Ausführen (weniger als eine Minute).
Danke für Ihr Feedback!
Awesome!
Completion rate improved to 3.57single