Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Evaluering av anbefalingsytelse med gjennomsnittlig kvadrert feil-metrikk | Dyp personalisering gjennom matrisefaktorisering
Market Basket Analysis og Anbefalingssystemer

Evaluering av anbefalingsytelse med gjennomsnittlig kvadrert feil-metrikk

Sveip for å vise menyen

Mean Squared Error (MSE): Definisjon, formel og tolkning

Note
Definisjon

Mean squared error, eller MSE, er en grunnleggende metrikk for å evaluere hvor nært et anbefalingssystems predikerte vurderinger samsvarer med faktiske brukervurderinger. Den måler gjennomsnittet av kvadratet av forskjellene mellom predikerte og faktiske verdier.

Formelen for MSE er:

MSE=1ni=1n(yiy^i)2\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

hvor:

  • yiy_i er faktisk vurdering for element ii;
  • y^i\hat{y}_i er predikert vurdering for element ii;
  • nn er totalt antall vurderinger som sammenlignes.

En lavere MSE-verdi betyr at prediksjonene er nærmere de faktiske vurderingene, mens en høyere MSE indikerer større feil mellom det systemet predikerer og det brukerne faktisk vurderte.

Hvordan beregne MSE for predikerte vs. faktiske vurderinger

For å beregne MSE følger du disse stegene:

  1. Trekk hver predikert vurdering fra den faktiske vurderingen for å finne feilen for hver prediksjon;
  2. Kvadrer hver feil for å sikre at alle verdier er positive og for å straffe større feil hardere;
  3. Legg sammen alle kvadrerte feil;
  4. Del totalen på antall prediksjoner for å finne gjennomsnittet.

Hvorfor MSE er viktig for modelevaluering

MSE er viktig fordi det gir et enkelt tall som oppsummerer den prediktive nøyaktigheten til et anbefalingssystem. Det er spesielt nyttig for å sammenligne ulike modeller eller justere parametere, siden en lavere MSE direkte reflekterer bedre ytelse i å forutsi brukerpreferanser. Fordi feilene kvadreres, er MSE følsom for store feil, noe som er nyttig når man ønsker å straffe store avvik ekstra mye.

Note
Les mer

RMSE (Root Mean Squared Error) er kvadratroten av MSE. Den uttrykker feilen i samme enheter som de opprinnelige vurderingene, noe som gjør det enklere å tolke hvor mye prediksjonene avviker fra faktiske brukervurderinger. RMSE brukes ofte sammen med MSE for å evaluere anbefalingssystemer fordi den gir en mer intuitiv forståelse av prediksjonens nøyaktighet.

Eksempel: Beregning av MSE for et sett med prediksjoner

Anta at du har et sett med faktiske brukervurderinger og systemets predikerte vurderinger for fem filmer:

  • Faktiske vurderinger: [4, 3, 5, 2, 1]
  • Predikerte vurderinger: [5, 2, 4, 2, 1]

Du beregner differansene, kvadrerer dem, summerer dem og deler på 5 (antall vurderinger) for å finne MSE.

12345678910111213
import numpy as np # Actual and predicted ratings actual_ratings = np.array([4, 3, 5, 2, 1]) predicted_ratings = np.array([5, 2, 4, 2, 1]) # Calculate squared differences squared_errors = (actual_ratings - predicted_ratings) ** 2 # Compute mean squared error mse = np.mean(squared_errors) print('Mean Squared Error:', mse)

1. Hvilket utsagn beskriver best hva en lavere gjennomsnittlig kvadrert feil (MSE) indikerer om prediksjonene til et anbefalingssystem?

2. Hvilket av følgende måltall måler direkte gjennomsnittlig kvadrert forskjell mellom predikerte og faktiske vurderinger i et anbefalingssystem?

question mark

Hvilket utsagn beskriver best hva en lavere gjennomsnittlig kvadrert feil (MSE) indikerer om prediksjonene til et anbefalingssystem?

Velg det helt riktige svaret

question mark

Hvilket av følgende måltall måler direkte gjennomsnittlig kvadrert forskjell mellom predikerte og faktiske vurderinger i et anbefalingssystem?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 4

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 4. Kapittel 4
some-alt