Evaluating Recommendation Performance With Mean Squared Error Metrics
Свайпніть щоб показати меню
Середньоквадратична помилка (MSE): визначення, формула та інтерпретація
Середньоквадратична помилка, або MSE, є базовою метрикою для оцінки того, наскільки точно передбачені рейтинги рекомендаційної системи відповідають фактичним оцінкам користувачів. Вона вимірює середнє значення квадратів різниць між передбаченими та фактичними значеннями.
Формула для MSE:
MSE=n1i=1∑n(yi−y^i)2де:
- yi — фактичний рейтинг для елемента i;
- y^i — передбачений рейтинг для елемента i;
- n — загальна кількість порівнюваних рейтингів.
Менше значення MSE означає, що передбачення ближчі до фактичних оцінок, тоді як більше значення MSE вказує на більші помилки між прогнозами системи та реальними оцінками користувачів.
Як обчислити MSE для передбачених і фактичних рейтингів
Щоб обчислити MSE, виконайте такі кроки:
- Відніміть кожен передбачений рейтинг від фактичного, щоб отримати помилку для кожного прогнозу;
- Піднесіть кожну помилку до квадрату, щоб усі значення були додатними та щоб сильніше штрафувати великі помилки;
- Складіть усі квадрати помилок;
- Поділіть суму на кількість прогнозів, щоб отримати середнє значення.
Чому MSE важлива для оцінки моделі
MSE важлива, оскільки надає одне число, яке підсумовує точність прогнозування рекомендаційної системи. Вона особливо корисна для порівняння різних моделей або налаштування параметрів, оскільки менше значення MSE безпосередньо відображає кращу здатність передбачати вподобання користувачів. Однак, оскільки помилки підносяться до квадрату, MSE чутлива до великих помилок, що корисно, коли потрібно сильніше штрафувати значні невідповідності.
RMSE (корінь середньоквадратичної помилки) — це квадратний корінь із MSE. Вона виражає помилку в тих самих одиницях, що й оригінальні оцінки, що полегшує інтерпретацію відхилення прогнозів від реальних оцінок користувачів. RMSE широко використовується разом із MSE для оцінки систем рекомендацій, оскільки дає більш інтуїтивне уявлення про точність прогнозування.
Приклад: обчислення MSE для набору прогнозів
Припустимо, у вас є набір фактичних оцінок користувачів і прогнозованих вашою системою оцінок для п’яти фільмів:
- Фактичні оцінки:
[4, 3, 5, 2, 1] - Прогнозовані оцінки:
[5, 2, 4, 2, 1]
Ви обчислюєте різниці, зводите їх у квадрат, підсумовуєте та ділите на 5 (кількість оцінок), щоб отримати MSE.
12345678910111213import numpy as np # Actual and predicted ratings actual_ratings = np.array([4, 3, 5, 2, 1]) predicted_ratings = np.array([5, 2, 4, 2, 1]) # Calculate squared differences squared_errors = (actual_ratings - predicted_ratings) ** 2 # Compute mean squared error mse = np.mean(squared_errors) print('Mean Squared Error:', mse)
1. Яке твердження найкраще описує, що означає нижче середньоквадратичне відхилення (MSE) для передбачень рекомендаторної системи?
2. Яка з наступних метрик безпосередньо вимірює середнє квадратичне відхилення між передбаченими та фактичними оцінками в рекомендаторній системі?
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат