Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Modelle | Modellierung
ML-Einführung Mit Scikit-Learn

bookModelle

Du kennst bereits die Grundlagen der Datenvorverarbeitung und den Aufbau von Pipelines. Jetzt können wir zum spannenden Teil übergehen: Modellierung!

Fassen wir zusammen, was ein Modell ist. In Scikit-learn handelt es sich um einen Estimator, der sowohl die Methoden .predict() als auch .score() besitzt (und da es sich um einen Estimator handelt, ist auch die Methode .fit() vorhanden).

.fit()

Sobald die Daten vorverarbeitet und bereit für das Modell sind, besteht der erste Schritt beim Aufbau eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).

Während des Trainings lernt ein Modell alles, was es für Vorhersagen benötigt. Was das Modell lernt und die Dauer des Trainings hängen vom gewählten Algorithmus ab. Für jede Aufgabe stehen zahlreiche Modelle auf Basis verschiedener Algorithmen zur Verfügung. Einige trainieren langsamer, andere schneller.

Das Training ist jedoch im Allgemeinen der zeitaufwändigste Aspekt des maschinellen Lernens. Ist der Trainingsdatensatz groß, kann das Training eines Modells Minuten, Stunden oder sogar Tage dauern.

.predict()

Sobald das Modell mit der Methode .fit() trainiert wurde, kann es Vorhersagen durchführen. Vorhersagen erfolgen einfach durch Aufruf der Methode .predict():

model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction

In der Regel soll ein Zielwert für neue Instanzen, X_new, vorhergesagt werden.

.score()

Die Methode .score() wird verwendet, um die Leistung eines trainierten Modells zu messen. In der Regel erfolgt dies auf dem Testdatensatz (die folgenden Kapitel erläutern dies genauer). Die Syntax lautet:

model.fit(X, y) # Training the model
model.score(X_test, y_test)

Die Methode .score() benötigt tatsächliche Zielwerte (y_test im Beispiel). Sie berechnet die Vorhersage für die Instanzen in X_test und vergleicht diese Vorhersage mit dem wahren Zielwert (y_test) anhand einer Metrik. Standardmäßig ist diese Metrik die Genauigkeit bei Klassifikationsaufgaben.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 1

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 3.13

bookModelle

Swipe um das Menü anzuzeigen

Du kennst bereits die Grundlagen der Datenvorverarbeitung und den Aufbau von Pipelines. Jetzt können wir zum spannenden Teil übergehen: Modellierung!

Fassen wir zusammen, was ein Modell ist. In Scikit-learn handelt es sich um einen Estimator, der sowohl die Methoden .predict() als auch .score() besitzt (und da es sich um einen Estimator handelt, ist auch die Methode .fit() vorhanden).

.fit()

Sobald die Daten vorverarbeitet und bereit für das Modell sind, besteht der erste Schritt beim Aufbau eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).

Während des Trainings lernt ein Modell alles, was es für Vorhersagen benötigt. Was das Modell lernt und die Dauer des Trainings hängen vom gewählten Algorithmus ab. Für jede Aufgabe stehen zahlreiche Modelle auf Basis verschiedener Algorithmen zur Verfügung. Einige trainieren langsamer, andere schneller.

Das Training ist jedoch im Allgemeinen der zeitaufwändigste Aspekt des maschinellen Lernens. Ist der Trainingsdatensatz groß, kann das Training eines Modells Minuten, Stunden oder sogar Tage dauern.

.predict()

Sobald das Modell mit der Methode .fit() trainiert wurde, kann es Vorhersagen durchführen. Vorhersagen erfolgen einfach durch Aufruf der Methode .predict():

model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction

In der Regel soll ein Zielwert für neue Instanzen, X_new, vorhergesagt werden.

.score()

Die Methode .score() wird verwendet, um die Leistung eines trainierten Modells zu messen. In der Regel erfolgt dies auf dem Testdatensatz (die folgenden Kapitel erläutern dies genauer). Die Syntax lautet:

model.fit(X, y) # Training the model
model.score(X_test, y_test)

Die Methode .score() benötigt tatsächliche Zielwerte (y_test im Beispiel). Sie berechnet die Vorhersage für die Instanzen in X_test und vergleicht diese Vorhersage mit dem wahren Zielwert (y_test) anhand einer Metrik. Standardmäßig ist diese Metrik die Genauigkeit bei Klassifikationsaufgaben.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 1
some-alt