Herausforderung: Den Besten K-Wert Wählen.
Wie in den vorherigen Kapiteln gezeigt, macht das Modell unterschiedliche Vorhersagen für verschiedene k(Wert der Nachbarn)-Werte.
Wenn wir ein Modell erstellen, möchten wir das k wählen, das zur besten Leistung führt. Und im vorherigen Kapitel haben wir gelernt, wie man die Leistung mit Kreuzvalidierung misst.
Eine Schleife auszuführen und Kreuzvalidierungsergebnisse für einige Bereiche von k-Werten zu berechnen, um den höchsten auszuwählen, klingt wie eine Selbstverständlichkeit. Und das ist der am häufigsten verwendete Ansatz. sklearn
hat eine praktische Klasse für diese Aufgabe.
Der param_grid
Parameter nimmt ein Wörterbuch mit Parameternamen als Schlüssel und eine Liste von Elementen, die durchlaufen werden sollen, als Liste. Zum Beispiel, um Werte von 1-99 für n_neighbors
auszuprobieren, würden Sie verwenden:
param_grid = {'n_neighbors': range(1, 100)}
Die .fit(X, y)
Methode führt das GridSearchCV
Objekt dazu, die besten Parameter aus param_grid
zu finden und das Modell mit den besten Parametern unter Verwendung des gesamten Satzes neu zu trainieren.
Sie können dann die höchste Punktzahl mit dem Attribut .best_score_
erhalten und neue Werte mit der Methode .predict()
vorhersagen.
Swipe to start coding
- Importieren Sie die
GridSearchCV
Klasse. - Skalieren Sie das
X
mitStandardScaler
. - Suchen Sie nach dem besten Wert von
n_neighbors
unter[3, 9, 18, 27]
. - Initialisieren und trainieren Sie ein
GridSearchCV
Objekt mit 4 Falten der Kreuzvalidierung. - Drucken Sie die Punktzahl des besten Modells.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.57
Herausforderung: Den Besten K-Wert Wählen.
Swipe um das Menü anzuzeigen
Wie in den vorherigen Kapiteln gezeigt, macht das Modell unterschiedliche Vorhersagen für verschiedene k(Wert der Nachbarn)-Werte.
Wenn wir ein Modell erstellen, möchten wir das k wählen, das zur besten Leistung führt. Und im vorherigen Kapitel haben wir gelernt, wie man die Leistung mit Kreuzvalidierung misst.
Eine Schleife auszuführen und Kreuzvalidierungsergebnisse für einige Bereiche von k-Werten zu berechnen, um den höchsten auszuwählen, klingt wie eine Selbstverständlichkeit. Und das ist der am häufigsten verwendete Ansatz. sklearn
hat eine praktische Klasse für diese Aufgabe.
Der param_grid
Parameter nimmt ein Wörterbuch mit Parameternamen als Schlüssel und eine Liste von Elementen, die durchlaufen werden sollen, als Liste. Zum Beispiel, um Werte von 1-99 für n_neighbors
auszuprobieren, würden Sie verwenden:
param_grid = {'n_neighbors': range(1, 100)}
Die .fit(X, y)
Methode führt das GridSearchCV
Objekt dazu, die besten Parameter aus param_grid
zu finden und das Modell mit den besten Parametern unter Verwendung des gesamten Satzes neu zu trainieren.
Sie können dann die höchste Punktzahl mit dem Attribut .best_score_
erhalten und neue Werte mit der Methode .predict()
vorhersagen.
Swipe to start coding
- Importieren Sie die
GridSearchCV
Klasse. - Skalieren Sie das
X
mitStandardScaler
. - Suchen Sie nach dem besten Wert von
n_neighbors
unter[3, 9, 18, 27]
. - Initialisieren und trainieren Sie ein
GridSearchCV
Objekt mit 4 Falten der Kreuzvalidierung. - Drucken Sie die Punktzahl des besten Modells.
Lösung
Danke für Ihr Feedback!
Awesome!
Completion rate improved to 3.57single