Modellierungszusammenfassung
Swipe um das Menü anzuzeigen
Sie wissen nun, wie man ein Modell erstellt, Pipelines verwendet und Hyperparameter abstimmt. Außerdem haben Sie zwei Evaluierungsmethoden kennengelernt: Train-Test-Split und Kreuzvalidierung.
Der nächste Schritt ist die Kombination von Evaluierung und Abstimmung mit GridSearchCV oder RandomizedSearchCV.
Da unser Datensatz sehr klein ist, verwenden wir das GridSearchCV, aber alles, was unten gesagt wird, gilt auch für ein RandomizedSearchCV.
Da die Kreuzvalidierung stabiler ist als ein einzelner Train-Test-Split, besteht das Ziel darin, den höchsten Kreuzvalidierungswert zu erreichen.
GridSearchCV durchsucht die Hyperparameter und findet diejenigen, die diesen Wert maximieren. Der beste Wert wird in .best_score_ gespeichert.
Hyperparameter, die für einen Datensatz am besten funktionieren, generalieren möglicherweise nicht, wenn neue Daten hinzukommen.
Daher kann .best_score_ höher sein als die Leistung des Modells auf vollständig unbekannten Daten.
Typischer Workflow: Aufteilen in Trainings- und Testdaten; Durchführung der Kreuzvalidierung auf dem Trainingsdatensatz, um das Modell abzustimmen; anschließend Bewertung des optimierten Modells auf dem Testdatensatz, um die reale Leistungsfähigkeit zu messen.
Zusammenfassung:
- Daten vorverarbeiten;
- In Trainings- und Testdaten aufteilen;
- Kreuzvalidierung auf dem Trainingsdatensatz durchführen, um die beste Konfiguration zu finden;
- Auf dem Testdatensatz auswerten.
Der dritte Schritt beinhaltet üblicherweise das Testen mehrerer Algorithmen und das Abstimmen ihrer Hyperparameter, um die beste Option zu identifizieren. Zur Vereinfachung wurde in diesem Kurs nur ein einzelner Algorithmus verwendet.
Kreuzvalidierung ist nicht immer die beste Option. Bei großen Datensätzen wird die Berechnung der CV-Werte aufwendig, während ein Train-Test-Split durch die große Testmenge stabiler wird.
Große Datensätze werden häufig in Trainings-, Validierungs- und Testmengen aufgeteilt. Hyperparameter werden basierend auf der Leistung auf dem Validierungsdatensatz ausgewählt. Abschließend wird das gewählte Modell auf dem Testdatensatz bewertet, um zu überprüfen, wie gut es generalisiert.
Der Penguins-Datensatz ist klein und umfasst nur 342 Instanzen. Aufgrund dieser begrenzten Größe wird im nächsten Kapitel der Kreuzvalidierungswert zur Bewertung verwendet.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen