Modelle
Die Grundlagen der Datenvorverarbeitung und des Pipeline-Aufbaus wurden nun behandelt. Der nächste Schritt ist das Modellieren.
Ein Modell in Scikit-learn ist ein Estimator, der die Methoden .predict() und .score() sowie .fit() von allen Estimatoren bereitstellt.
.fit()
Sobald die Daten vorverarbeitet und für das Modell bereit sind, besteht der erste Schritt beim Erstellen eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).
Für überwachtes Lernen (Regression, Klassifikation) erfordert .fit() sowohl X als auch y.
Für unüberwachtes Lernen (z. B. Clustering) wird nur .fit(X) aufgerufen. Das Übergeben von y führt nicht zu einem Fehler — es wird einfach ignoriert.
Während des Trainings lernt das Modell Muster, die für Vorhersagen benötigt werden. Was gelernt wird und wie lange das Training dauert, hängt vom jeweiligen Algorithmus ab. Das Training ist oft der langsamste Teil des maschinellen Lernens, insbesondere bei großen Datensätzen.
.predict()
Nach dem Training wird .predict() verwendet, um Vorhersagen zu generieren:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() bewertet ein trainiertes Modell, typischerweise auf einem Testdatensatz:
model.fit(X, y)
model.score(X_test, y_test)
Es vergleicht Vorhersagen mit den tatsächlichen Zielwerten. Standardmäßig ist die Metrik für Klassifikation die Genauigkeit.
X_test bezeichnet den Teil des Datensatzes, bekannt als Testdatensatz, der zur Bewertung der Modellleistung nach dem Training verwendet wird. Er enthält die Merkmale (Eingabedaten). y_test ist der entsprechende Teil der wahren Labels für X_test. Zusammen bewerten sie, wie gut das Modell neue, unbekannte Daten vorhersagt.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.13
Modelle
Swipe um das Menü anzuzeigen
Die Grundlagen der Datenvorverarbeitung und des Pipeline-Aufbaus wurden nun behandelt. Der nächste Schritt ist das Modellieren.
Ein Modell in Scikit-learn ist ein Estimator, der die Methoden .predict() und .score() sowie .fit() von allen Estimatoren bereitstellt.
.fit()
Sobald die Daten vorverarbeitet und für das Modell bereit sind, besteht der erste Schritt beim Erstellen eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).
Für überwachtes Lernen (Regression, Klassifikation) erfordert .fit() sowohl X als auch y.
Für unüberwachtes Lernen (z. B. Clustering) wird nur .fit(X) aufgerufen. Das Übergeben von y führt nicht zu einem Fehler — es wird einfach ignoriert.
Während des Trainings lernt das Modell Muster, die für Vorhersagen benötigt werden. Was gelernt wird und wie lange das Training dauert, hängt vom jeweiligen Algorithmus ab. Das Training ist oft der langsamste Teil des maschinellen Lernens, insbesondere bei großen Datensätzen.
.predict()
Nach dem Training wird .predict() verwendet, um Vorhersagen zu generieren:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() bewertet ein trainiertes Modell, typischerweise auf einem Testdatensatz:
model.fit(X, y)
model.score(X_test, y_test)
Es vergleicht Vorhersagen mit den tatsächlichen Zielwerten. Standardmäßig ist die Metrik für Klassifikation die Genauigkeit.
X_test bezeichnet den Teil des Datensatzes, bekannt als Testdatensatz, der zur Bewertung der Modellleistung nach dem Training verwendet wird. Er enthält die Merkmale (Eingabedaten). y_test ist der entsprechende Teil der wahren Labels für X_test. Zusammen bewerten sie, wie gut das Modell neue, unbekannte Daten vorhersagt.
Danke für Ihr Feedback!