Lære Evaluering av anbefalingsytelse med gjennomsnittlig kvadrert feil-metrikk | Dyp personalisering gjennom matrisefaktorisering

Sveip for å vise menyen

Mean Squared Error (MSE): Definisjon, formel og tolkning

Definisjon

Mean squared error, eller MSE, er en grunnleggende metrikk for å evaluere hvor nært et anbefalingssystems predikerte vurderinger samsvarer med faktiske brukervurderinger. Den måler gjennomsnittet av kvadratet av forskjellene mellom predikerte og faktiske verdier.

Formelen for MSE er:

\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

hvor:

$y_i$ er faktisk vurdering for element $i$ ;
$\hat{y}_i$ er predikert vurdering for element $i$ ;
$n$ er totalt antall vurderinger som sammenlignes.

En lavere MSE-verdi betyr at prediksjonene er nærmere de faktiske vurderingene, mens en høyere MSE indikerer større feil mellom det systemet predikerer og det brukerne faktisk vurderte.

Hvordan beregne MSE for predikerte vs. faktiske vurderinger

For å beregne MSE følger du disse stegene:

Trekk hver predikert vurdering fra den faktiske vurderingen for å finne feilen for hver prediksjon;
Kvadrer hver feil for å sikre at alle verdier er positive og for å straffe større feil hardere;
Legg sammen alle kvadrerte feil;
Del totalen på antall prediksjoner for å finne gjennomsnittet.

Hvorfor MSE er viktig for modelevaluering

MSE er viktig fordi det gir et enkelt tall som oppsummerer den prediktive nøyaktigheten til et anbefalingssystem. Det er spesielt nyttig for å sammenligne ulike modeller eller justere parametere, siden en lavere MSE direkte reflekterer bedre ytelse i å forutsi brukerpreferanser. Fordi feilene kvadreres, er MSE følsom for store feil, noe som er nyttig når man ønsker å straffe store avvik ekstra mye.

Les mer

RMSE (Root Mean Squared Error) er kvadratroten av MSE. Den uttrykker feilen i samme enheter som de opprinnelige vurderingene, noe som gjør det enklere å tolke hvor mye prediksjonene avviker fra faktiske brukervurderinger. RMSE brukes ofte sammen med MSE for å evaluere anbefalingssystemer fordi den gir en mer intuitiv forståelse av prediksjonens nøyaktighet.

Eksempel: Beregning av MSE for et sett med prediksjoner

Anta at du har et sett med faktiske brukervurderinger og systemets predikerte vurderinger for fem filmer:

Faktiske vurderinger: [4, 3, 5, 2, 1]
Predikerte vurderinger: [5, 2, 4, 2, 1]

Du beregner differansene, kvadrerer dem, summerer dem og deler på 5 (antall vurderinger) for å finne MSE.


              12345678910111213
            
import numpy as np

# Actual and predicted ratings
actual_ratings = np.array([4, 3, 5, 2, 1])
predicted_ratings = np.array([5, 2, 4, 2, 1])

# Calculate squared differences
squared_errors = (actual_ratings - predicted_ratings) ** 2

# Compute mean squared error
mse = np.mean(squared_errors)

print('Mean Squared Error:', mse)

1. Hvilket utsagn beskriver best hva en lavere gjennomsnittlig kvadrert feil (MSE) indikerer om prediksjonene til et anbefalingssystem?

2. Hvilket av følgende måltall måler direkte gjennomsnittlig kvadrert forskjell mellom predikerte og faktiske vurderinger i et anbefalingssystem?

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 4

Spør AI

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 4. Kapittel 4