Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Навчальна Вибірка | Концепції Машинного Навчання
Вступ до ML з Scikit-learn

bookНавчальна Вибірка

У задачах з навчанням з учителем або без учителя навчальна вибірка зазвичай подається у табличному форматі.

Прикладом є набір даних про діабет, який використовується для прогнозування наявності діабету у людини. Він містить записи про 768 жінок із такими параметрами, як вік, індекс маси тіла та артеріальний тиск. Ці параметри називаються ознаками.

У наборі даних також є стовпець 'Outcome', який вказує, чи має людина діабет. Це цільова змінна.

Кожен рядок у таблиці — це екземпляр (також називається точкою даних або зразком), що представляє інформацію про окрему особу.

Таблиця (навчальна вибірка) містить цільовий стовпець, тобто вона має мітки.

Завдання полягає у навчанні ML-моделі на цій навчальній вибірці, і після навчання вона зможе прогнозувати для інших людей (нових екземплярів), чи є у них діабет, використовуючи лише ознаки.

Note
Примітка

Ця навчальна вибірка є прикладом упередженого набору даних, оскільки містить інформацію виключно про жінок віком від 21 року. Тому модель може давати менш точні прогнози для чоловіків або жінок молодше 21 року, оскільки вона не навчалася на цих групах.

Під час програмування стовпці ознак зазвичай призначаються змінній X, а стовпці цільових значень — змінній y.

Ознаки нових екземплярів призначаються як X_new.

question-icon

Відповідність назв змінних даним, які вони зазвичай містять.

X –
y –

X_new –

Натисніть або перетягніть елементи та заповніть пропуски

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 3

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 3.13

bookНавчальна Вибірка

Свайпніть щоб показати меню

У задачах з навчанням з учителем або без учителя навчальна вибірка зазвичай подається у табличному форматі.

Прикладом є набір даних про діабет, який використовується для прогнозування наявності діабету у людини. Він містить записи про 768 жінок із такими параметрами, як вік, індекс маси тіла та артеріальний тиск. Ці параметри називаються ознаками.

У наборі даних також є стовпець 'Outcome', який вказує, чи має людина діабет. Це цільова змінна.

Кожен рядок у таблиці — це екземпляр (також називається точкою даних або зразком), що представляє інформацію про окрему особу.

Таблиця (навчальна вибірка) містить цільовий стовпець, тобто вона має мітки.

Завдання полягає у навчанні ML-моделі на цій навчальній вибірці, і після навчання вона зможе прогнозувати для інших людей (нових екземплярів), чи є у них діабет, використовуючи лише ознаки.

Note
Примітка

Ця навчальна вибірка є прикладом упередженого набору даних, оскільки містить інформацію виключно про жінок віком від 21 року. Тому модель може давати менш точні прогнози для чоловіків або жінок молодше 21 року, оскільки вона не навчалася на цих групах.

Під час програмування стовпці ознак зазвичай призначаються змінній X, а стовпці цільових значень — змінній y.

Ознаки нових екземплярів призначаються як X_new.

question-icon

Відповідність назв змінних даним, які вони зазвичай містять.

X –
y –

X_new –

Натисніть або перетягніть елементи та заповніть пропуски

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 3
some-alt