Вивчайте Evaluating Recommendation Performance With Mean Squared Error Metrics | Глибока персоналізація через матричну факторизацію

Свайпніть щоб показати меню

Середньоквадратична помилка (MSE): визначення, формула та інтерпретація

Визначення

Середньоквадратична помилка, або MSE, є базовою метрикою для оцінки того, наскільки точно передбачені рейтинги рекомендаційної системи відповідають фактичним оцінкам користувачів. Вона вимірює середнє значення квадратів різниць між передбаченими та фактичними значеннями.

Формула для MSE:

\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

де:

$y_i$ — фактичний рейтинг для елемента $i$ ;
$\hat{y}_i$ — передбачений рейтинг для елемента $i$ ;
$n$ — загальна кількість порівнюваних рейтингів.

Менше значення MSE означає, що передбачення ближчі до фактичних оцінок, тоді як більше значення MSE вказує на більші помилки між прогнозами системи та реальними оцінками користувачів.

Як обчислити MSE для передбачених і фактичних рейтингів

Щоб обчислити MSE, виконайте такі кроки:

Відніміть кожен передбачений рейтинг від фактичного, щоб отримати помилку для кожного прогнозу;
Піднесіть кожну помилку до квадрату, щоб усі значення були додатними та щоб сильніше штрафувати великі помилки;
Складіть усі квадрати помилок;
Поділіть суму на кількість прогнозів, щоб отримати середнє значення.

Чому MSE важлива для оцінки моделі

MSE важлива, оскільки надає одне число, яке підсумовує точність прогнозування рекомендаційної системи. Вона особливо корисна для порівняння різних моделей або налаштування параметрів, оскільки менше значення MSE безпосередньо відображає кращу здатність передбачати вподобання користувачів. Однак, оскільки помилки підносяться до квадрату, MSE чутлива до великих помилок, що корисно, коли потрібно сильніше штрафувати значні невідповідності.

Детальніше

RMSE (корінь середньоквадратичної помилки) — це квадратний корінь із MSE. Вона виражає помилку в тих самих одиницях, що й оригінальні оцінки, що полегшує інтерпретацію відхилення прогнозів від реальних оцінок користувачів. RMSE широко використовується разом із MSE для оцінки систем рекомендацій, оскільки дає більш інтуїтивне уявлення про точність прогнозування.

Приклад: обчислення MSE для набору прогнозів

Припустимо, у вас є набір фактичних оцінок користувачів і прогнозованих вашою системою оцінок для п’яти фільмів:

Фактичні оцінки: [4, 3, 5, 2, 1]
Прогнозовані оцінки: [5, 2, 4, 2, 1]

Ви обчислюєте різниці, зводите їх у квадрат, підсумовуєте та ділите на 5 (кількість оцінок), щоб отримати MSE.


              12345678910111213
            
import numpy as np

# Actual and predicted ratings
actual_ratings = np.array([4, 3, 5, 2, 1])
predicted_ratings = np.array([5, 2, 4, 2, 1])

# Calculate squared differences
squared_errors = (actual_ratings - predicted_ratings) ** 2

# Compute mean squared error
mse = np.mean(squared_errors)

print('Mean Squared Error:', mse)

1. Яке твердження найкраще описує, що означає нижче середньоквадратичне відхилення (MSE) для передбачень рекомендаторної системи?

2. Яка з наступних метрик безпосередньо вимірює середнє квадратичне відхилення між передбаченими та фактичними оцінками в рекомендаторній системі?

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 4. Розділ 4

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 4. Розділ 4