Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Modellbewertung | Abschnitt
PyTorch-Grundlagen für ML-Ingenieure

bookModellbewertung

Vorbereitung auf die Auswertung

Vor Beginn des Auswertungsprozesses auf dem Testdatensatz sind folgende Punkte sicherzustellen:

  1. Modell in den Evaluierungsmodus versetzen: Mit model.eval() werden Funktionen wie Dropout und Batch-Normalisierung deaktiviert, um ein konsistentes Verhalten während der Auswertung zu gewährleisten;

  2. Deaktivieren des Gradienten-Trackings: Mit torch.no_grad() wird Speicher gespart und die Berechnung beschleunigt, da während der Auswertung keine Gradienten benötigt werden.

# Set the model to evaluation mode
model.eval()
# Disable gradient computation for evaluation
with torch.no_grad():
    # Forward pass on the test data
    test_predictions = model(X_test)

Umwandlung von Vorhersagen

Wie bereits zuvor erwähnt, liefert das Modell Logits (Rohwerte) als Ausgabe. Um die vorhergesagten Klassenlabels zu erhalten, wird torch.argmax verwendet, um den Index des maximalen Werts entlang der Klassendimension zu extrahieren.

# Convert logits to predicted class labels
predicted_labels = torch.argmax(test_predictions, dim=1)

Berechnung von Metriken

Für Klassifikationsprobleme ist die Genauigkeit ein nützlicher Anfangswert, sofern der Datensatz ausgewogen ist.

# Calculate accuracy
correct_predictions = (predicted_labels == y_test).sum().item()
accuracy = correct_predictions / len(y_test) * 100
print(f"Test accuracy: {accuracy:.2f}%")
Note
Mehr erfahren

Wenn der Datensatz unausgewogen ist – das bedeutet, dass eine Klasse die anderen deutlich überwiegt – kann die Genauigkeit irreführend sein. Ein Modell, das immer die Mehrheitsklasse vorhersagt, kann eine hohe Genauigkeit erreichen, erfasst jedoch nicht die tatsächliche Leistung über alle Klassen hinweg.

Um ein tieferes Verständnis der Modellleistung zu erhalten, können zusätzliche Metriken wie Präzision, Recall und F1-Score berechnet werden. Weitere Informationen zu diesen Metriken und deren Formeln finden Sie in diesem Artikel, mit den jeweiligen Formeln.

Vollständige Implementierung

123456789101112131415161718
import torch import os os.system('wget https://staging-content-media-cdn.codefinity.com/courses/1dd2b0f6-6ec0-40e6-a570-ed0ac2209666/section_3/model_training.py 2>/dev/null') from model_training import model, X_test, y_test # Set model to evaluation mode model.eval() # Disable gradient tracking with torch.no_grad(): # Forward pass test_predictions = model(X_test) # Get predicted classes predicted_labels = torch.argmax(test_predictions, dim=1) # Calculate accuracy correct_predictions = (predicted_labels == y_test).sum().item() accuracy = correct_predictions / len(y_test) * 100 print(f"Test accuracy: {accuracy:.2f}%")
copy
question mark

Welcher der folgenden Schritte ist beim Evaluieren eines trainierten PyTorch-Modells erforderlich?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 19

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

bookModellbewertung

Swipe um das Menü anzuzeigen

Vorbereitung auf die Auswertung

Vor Beginn des Auswertungsprozesses auf dem Testdatensatz sind folgende Punkte sicherzustellen:

  1. Modell in den Evaluierungsmodus versetzen: Mit model.eval() werden Funktionen wie Dropout und Batch-Normalisierung deaktiviert, um ein konsistentes Verhalten während der Auswertung zu gewährleisten;

  2. Deaktivieren des Gradienten-Trackings: Mit torch.no_grad() wird Speicher gespart und die Berechnung beschleunigt, da während der Auswertung keine Gradienten benötigt werden.

# Set the model to evaluation mode
model.eval()
# Disable gradient computation for evaluation
with torch.no_grad():
    # Forward pass on the test data
    test_predictions = model(X_test)

Umwandlung von Vorhersagen

Wie bereits zuvor erwähnt, liefert das Modell Logits (Rohwerte) als Ausgabe. Um die vorhergesagten Klassenlabels zu erhalten, wird torch.argmax verwendet, um den Index des maximalen Werts entlang der Klassendimension zu extrahieren.

# Convert logits to predicted class labels
predicted_labels = torch.argmax(test_predictions, dim=1)

Berechnung von Metriken

Für Klassifikationsprobleme ist die Genauigkeit ein nützlicher Anfangswert, sofern der Datensatz ausgewogen ist.

# Calculate accuracy
correct_predictions = (predicted_labels == y_test).sum().item()
accuracy = correct_predictions / len(y_test) * 100
print(f"Test accuracy: {accuracy:.2f}%")
Note
Mehr erfahren

Wenn der Datensatz unausgewogen ist – das bedeutet, dass eine Klasse die anderen deutlich überwiegt – kann die Genauigkeit irreführend sein. Ein Modell, das immer die Mehrheitsklasse vorhersagt, kann eine hohe Genauigkeit erreichen, erfasst jedoch nicht die tatsächliche Leistung über alle Klassen hinweg.

Um ein tieferes Verständnis der Modellleistung zu erhalten, können zusätzliche Metriken wie Präzision, Recall und F1-Score berechnet werden. Weitere Informationen zu diesen Metriken und deren Formeln finden Sie in diesem Artikel, mit den jeweiligen Formeln.

Vollständige Implementierung

123456789101112131415161718
import torch import os os.system('wget https://staging-content-media-cdn.codefinity.com/courses/1dd2b0f6-6ec0-40e6-a570-ed0ac2209666/section_3/model_training.py 2>/dev/null') from model_training import model, X_test, y_test # Set model to evaluation mode model.eval() # Disable gradient tracking with torch.no_grad(): # Forward pass test_predictions = model(X_test) # Get predicted classes predicted_labels = torch.argmax(test_predictions, dim=1) # Calculate accuracy correct_predictions = (predicted_labels == y_test).sum().item() accuracy = correct_predictions / len(y_test) * 100 print(f"Test accuracy: {accuracy:.2f}%")
copy
question mark

Welcher der folgenden Schritte ist beim Evaluieren eines trainierten PyTorch-Modells erforderlich?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 19
some-alt