Swipe um das Menü anzuzeigen

Die Grundlagen der Datenvorverarbeitung und des Pipeline-Aufbaus wurden nun behandelt. Der nächste Schritt ist das Modellieren.

Ein Modell in Scikit-learn ist ein Estimator, der die Methoden .predict() und .score() bereitstellt sowie .fit(), das von allen Estimatoren geerbt wird.

.fit()

Nachdem die Daten vorverarbeitet und für das Modell bereit sind, besteht der erste Schritt beim Erstellen eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).

Hinweis

Für das überwachte Lernen (Regression, Klassifikation) benötigt .fit() sowohl X als auch y. Für das unüberwachte Lernen (z. B. Clustering) wird nur .fit(X) aufgerufen. Das Übergeben von y führt nicht zu einem Fehler — es wird einfach ignoriert.

Während des Trainings lernt das Modell Muster, die für Vorhersagen benötigt werden. Was gelernt wird und wie lange das Training dauert, hängt vom Algorithmus ab. Das Training ist oft der langsamste Teil des maschinellen Lernens, insbesondere bei großen Datensätzen.

.predict()

Nach dem Training wird .predict() verwendet, um Vorhersagen zu generieren:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() bewertet ein trainiertes Modell, typischerweise auf einem Testdatensatz:

model.fit(X, y)
model.score(X_test, y_test)

Vergleicht Vorhersagen mit den tatsächlichen Zielwerten. Standardmäßig ist die Metrik Genauigkeit bei Klassifikationsaufgaben.

Hinweis

X_test bezeichnet den Teil des Datensatzes, der als Testmenge bekannt ist und zur Bewertung der Modellleistung nach dem Training verwendet wird. Er enthält die Merkmale (Eingabedaten). y_test ist der entsprechende Teil der wahren Labels für X_test. Zusammen dienen sie dazu, zu beurteilen, wie gut das Modell neue, unbekannte Daten vorhersagt.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 1

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Modelle

Die Grundlagen der Datenvorverarbeitung und des Pipeline-Aufbaus wurden nun behandelt. Der nächste Schritt ist das Modellieren.

Ein Modell in Scikit-learn ist ein Estimator, der die Methoden .predict() und .score() bereitstellt sowie .fit(), das von allen Estimatoren geerbt wird.

.fit()

Nachdem die Daten vorverarbeitet und für das Modell bereit sind, besteht der erste Schritt beim Erstellen eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).

Hinweis

.predict()

Nach dem Training wird .predict() verwendet, um Vorhersagen zu generieren:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() bewertet ein trainiertes Modell, typischerweise auf einem Testdatensatz:

model.fit(X, y)
model.score(X_test, y_test)

Vergleicht Vorhersagen mit den tatsächlichen Zielwerten. Standardmäßig ist die Metrik Genauigkeit bei Klassifikationsaufgaben.

Hinweis

War alles klar?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 1