Leer Het Evalueren van de Aanbevelingsprestaties met Behulp van Mean Squared Error-Metrieken | Diepe Personalisatie via Matrixfactorisatie

Veeg om het menu te tonen

Mean Squared Error (MSE): Definitie, formule en interpretatie

Definitie

Mean squared error, of MSE, is een fundamentele maatstaf voor het evalueren van hoe nauwkeurig de voorspelde beoordelingen van een aanbevelingssysteem overeenkomen met de werkelijke gebruikersbeoordelingen. Het meet het gemiddelde van de kwadraten van de verschillen tussen voorspelde en werkelijke waarden.

De formule voor MSE is:

\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

waarbij:

$y_i$ de werkelijke beoordeling is voor item $i$ ;
$\hat{y}_i$ de voorspelde beoordeling is voor item $i$ ;
$n$ het totale aantal vergeleken beoordelingen is.

Een lagere MSE-waarde betekent dat de voorspellingen dichter bij de werkelijke beoordelingen liggen, terwijl een hogere MSE wijst op grotere fouten tussen wat het systeem voorspelt en wat gebruikers daadwerkelijk hebben beoordeeld.

Hoe MSE te berekenen voor voorspelde versus werkelijke beoordelingen

Om MSE te berekenen, volg je deze stappen:

Trek elke voorspelde beoordeling af van de werkelijke beoordeling om de fout voor elke voorspelling te bepalen;
Kwadreer elke fout om ervoor te zorgen dat alle waarden positief zijn en om grotere fouten zwaarder te laten wegen;
Tel alle gekwadrateerde fouten op;
Deel het totaal door het aantal voorspellingen om het gemiddelde te verkrijgen.

Waarom MSE belangrijk is voor modelevaluatie

MSE is belangrijk omdat het één getal biedt dat de voorspellende nauwkeurigheid van een aanbevelingssysteem samenvat. Het is vooral nuttig voor het vergelijken van verschillende modellen of het afstemmen van parameters, omdat een lagere MSE direct een betere prestatie in het voorspellen van gebruikersvoorkeuren weerspiegelt. Omdat fouten worden gekwadrateerd, is MSE gevoelig voor grote fouten, wat nuttig is wanneer je grote afwijkingen zwaarder wilt bestraffen.

Meer leren

RMSE (Root Mean Squared Error) is de vierkantswortel van de MSE. Het drukt de fout uit in dezelfde eenheden als de oorspronkelijke beoordelingen, waardoor het eenvoudiger wordt om te interpreteren hoe ver voorspellingen afwijken van de werkelijke gebruikersbeoordelingen. RMSE wordt veel gebruikt naast MSE om aanbevelingssystemen te evalueren, omdat het een intuïtiever beeld geeft van de nauwkeurigheid van voorspellingen.

Voorbeeld: MSE berekenen voor een set voorspellingen

Stel dat je een set werkelijke gebruikersbeoordelingen en de voorspelde beoordelingen van je systeem hebt voor vijf films:

Werkelijke beoordelingen: [4, 3, 5, 2, 1]
Voorspelde beoordelingen: [5, 2, 4, 2, 1]

Je zou de verschillen berekenen, deze kwadrateren, optellen en delen door 5 (het aantal beoordelingen) om de MSE te verkrijgen.


              12345678910111213
            
import numpy as np

# Actual and predicted ratings
actual_ratings = np.array([4, 3, 5, 2, 1])
predicted_ratings = np.array([5, 2, 4, 2, 1])

# Calculate squared differences
squared_errors = (actual_ratings - predicted_ratings) ** 2

# Compute mean squared error
mse = np.mean(squared_errors)

print('Mean Squared Error:', mse)

1. Welke uitspraak beschrijft het beste wat een lagere mean squared error (MSE) aangeeft over de voorspellingen van een aanbevelingssysteem?

2. Welke van de volgende statistieken meet direct het gemiddelde kwadratische verschil tussen voorspelde en werkelijke beoordelingen in een aanbevelingssysteem?

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 4

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 4. Hoofdstuk 4