Modelle
Du kennst bereits die Grundlagen der Datenvorverarbeitung und den Aufbau von Pipelines. Jetzt können wir zum spannenden Teil übergehen: Modellierung!
Fassen wir zusammen, was ein Modell ist. In Scikit-learn handelt es sich um einen Estimator, der sowohl die Methoden .predict()
als auch .score()
besitzt (und da es sich um einen Estimator handelt, ist auch die Methode .fit()
vorhanden).
.fit()
Sobald die Daten vorverarbeitet und bereit für das Modell sind, besteht der erste Schritt beim Aufbau eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y)
.
Während des Trainings lernt ein Modell alles, was es für Vorhersagen benötigt. Was das Modell lernt und die Dauer des Trainings hängen vom gewählten Algorithmus ab. Für jede Aufgabe stehen zahlreiche Modelle auf Basis verschiedener Algorithmen zur Verfügung. Einige trainieren langsamer, andere schneller.
Das Training ist jedoch im Allgemeinen der zeitaufwändigste Aspekt des maschinellen Lernens. Ist der Trainingsdatensatz groß, kann das Training eines Modells Minuten, Stunden oder sogar Tage dauern.
.predict()
Sobald das Modell mit der Methode .fit()
trainiert wurde, kann es Vorhersagen durchführen. Vorhersagen erfolgen einfach durch Aufruf der Methode .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
In der Regel soll ein Zielwert für neue Instanzen, X_new
, vorhergesagt werden.
.score()
Die Methode .score()
wird verwendet, um die Leistung eines trainierten Modells zu messen. In der Regel erfolgt dies auf dem Testdatensatz (die folgenden Kapitel erläutern dies genauer). Die Syntax lautet:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Die Methode .score()
benötigt tatsächliche Zielwerte (y_test
im Beispiel). Sie berechnet die Vorhersage für die Instanzen in X_test
und vergleicht diese Vorhersage mit dem wahren Zielwert (y_test
) anhand einer Metrik. Standardmäßig ist diese Metrik die Genauigkeit bei Klassifikationsaufgaben.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.13
Modelle
Swipe um das Menü anzuzeigen
Du kennst bereits die Grundlagen der Datenvorverarbeitung und den Aufbau von Pipelines. Jetzt können wir zum spannenden Teil übergehen: Modellierung!
Fassen wir zusammen, was ein Modell ist. In Scikit-learn handelt es sich um einen Estimator, der sowohl die Methoden .predict()
als auch .score()
besitzt (und da es sich um einen Estimator handelt, ist auch die Methode .fit()
vorhanden).
.fit()
Sobald die Daten vorverarbeitet und bereit für das Modell sind, besteht der erste Schritt beim Aufbau eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y)
.
Während des Trainings lernt ein Modell alles, was es für Vorhersagen benötigt. Was das Modell lernt und die Dauer des Trainings hängen vom gewählten Algorithmus ab. Für jede Aufgabe stehen zahlreiche Modelle auf Basis verschiedener Algorithmen zur Verfügung. Einige trainieren langsamer, andere schneller.
Das Training ist jedoch im Allgemeinen der zeitaufwändigste Aspekt des maschinellen Lernens. Ist der Trainingsdatensatz groß, kann das Training eines Modells Minuten, Stunden oder sogar Tage dauern.
.predict()
Sobald das Modell mit der Methode .fit()
trainiert wurde, kann es Vorhersagen durchführen. Vorhersagen erfolgen einfach durch Aufruf der Methode .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
In der Regel soll ein Zielwert für neue Instanzen, X_new
, vorhergesagt werden.
.score()
Die Methode .score()
wird verwendet, um die Leistung eines trainierten Modells zu messen. In der Regel erfolgt dies auf dem Testdatensatz (die folgenden Kapitel erläutern dies genauer). Die Syntax lautet:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Die Methode .score()
benötigt tatsächliche Zielwerte (y_test
im Beispiel). Sie berechnet die Vorhersage für die Instanzen in X_test
und vergleicht diese Vorhersage mit dem wahren Zielwert (y_test
) anhand einer Metrik. Standardmäßig ist diese Metrik die Genauigkeit bei Klassifikationsaufgaben.
Danke für Ihr Feedback!