Oppiskele Suositusjärjestelmän Suorituskyvyn Arviointi Keskineliövirhemetriikoilla | Syvä Personointi Matriisihajotelman Avulla

Pyyhkäise näyttääksesi valikon

Keskineliövirhe (MSE): Määritelmä, kaava ja tulkinta

Määritelmä

Keskineliövirhe eli MSE on keskeinen mittari arvioitaessa, kuinka hyvin suositusjärjestelmän ennustetut arvosanat vastaavat todellisia käyttäjäarvosanoja. Se mittaa ennustettujen ja todellisten arvojen erotusten neliöiden keskiarvon.

MSE:n kaava on:

\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

missä:

$y_i$ on kohteen $i$ todellinen arvosana;
$\hat{y}_i$ on kohteen $i$ ennustettu arvosana;
$n$ on verrattavien arvosanojen kokonaismäärä.

Pienempi MSE-arvo tarkoittaa, että ennusteet ovat lähempänä todellisia arvosanoja, kun taas suurempi MSE viittaa suurempiin virheisiin järjestelmän ennusteiden ja käyttäjien todellisten arvosanojen välillä.

MSE:n laskeminen ennustettujen ja todellisten arvosanojen välillä

MSE lasketaan seuraavasti:

Vähennä jokainen ennustettu arvosana todellisesta arvosanasta saadaksesi virheen jokaiselle ennusteelle;
Neliöi jokainen virhe, jotta kaikki arvot ovat positiivisia ja suuremmat virheet painottuvat enemmän;
Laske yhteen kaikki neliöidyt virheet;
Jaa summa ennusteiden määrällä saadaksesi keskiarvon.

Miksi MSE on tärkeä mallin arvioinnissa

MSE on tärkeä, koska se antaa yksittäisen luvun, joka tiivistää suositusjärjestelmän ennustetarkkuuden. Se on erityisen hyödyllinen eri mallien vertailussa tai parametrien säätämisessä, sillä pienempi MSE heijastaa suoraan parempaa suorituskykyä käyttäjäpreferenssien ennustamisessa. Koska virheet neliöidään, MSE on herkkä suurille virheille, mikä on hyödyllistä, kun halutaan rangaista suurista poikkeamista voimakkaammin.

Opiskele lisää

RMSE (Root Mean Squared Error) on MSE:n neliöjuuri. Se ilmaisee virheen samoissa yksiköissä kuin alkuperäiset arviot, mikä helpottaa tulkintaa siitä, kuinka kaukana ennusteet ovat todellisista käyttäjäarvioista. RMSE:tä käytetään laajasti yhdessä MSE:n kanssa suositusjärjestelmien arvioinnissa, koska se antaa intuitiivisemman käsityksen ennustetarkkuudesta.

Esimerkki: MSE:n laskeminen ennusteille

Oletetaan, että sinulla on joukko todellisia käyttäjäarvioita ja järjestelmäsi ennustamia arvosanoja viidelle elokuvalle:

Todelliset arviot: [4, 3, 5, 2, 1]
Ennustetut arviot: [5, 2, 4, 2, 1]

Lasket erotukset, korotat ne toiseen, lasket summan ja jaat viidellä (arvioiden määrä) saadaksesi MSE:n.


              12345678910111213
            
import numpy as np

# Actual and predicted ratings
actual_ratings = np.array([4, 3, 5, 2, 1])
predicted_ratings = np.array([5, 2, 4, 2, 1])

# Calculate squared differences
squared_errors = (actual_ratings - predicted_ratings) ** 2

# Compute mean squared error
mse = np.mean(squared_errors)

print('Mean Squared Error:', mse)

1. Mikä seuraavista väittämistä kuvaa parhaiten, mitä pienempi keskineliövirhe (MSE) kertoo suositusjärjestelmän ennusteista?

2. Mikä seuraavista mittareista mittaa suoraan ennustettujen ja todellisten arvioiden välisten erotusten neliöiden keskiarvon suositusjärjestelmässä?

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 4. Luku 4

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 4. Luku 4