Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Робочий процес машинного навчання | Концепції Машинного Навчання
Вступ до машинного навчання з Python

bookРобочий процес машинного навчання

Розглянемо робочий процес, який необхідно пройти для створення успішного проєкту машинного навчання.

Крок 1. Отримання даних

Визначення задачі, вибір метрики ефективності та встановлення критеріїв для хорошого результату. Далі — збір необхідних даних із доступних джерел та приведення їх до формату, придатного для використання в Python. Якщо дані вже збережені у CSV-файлі, можна одразу переходити до попередньої обробки.

Приклад

Лікарня збирає записи пацієнтів та демографічні дані у CSV-файл. Мета — прогнозування повторних госпіталізацій з точністю понад 80%.

Крок 2. Попередня обробка даних

Цей етап включає:

  • Очищення даних: обробка пропущених значень і нечислових даних;
  • EDA: аналіз і візуалізація даних для виявлення зв'язків і проблем;
  • Фічерінженерія: вибір або створення ознак, що підвищують ефективність моделі.

Приклад

Пропущені значення (наприклад, артеріальний тиск) заповнюються, а категоріальні ознаки (наприклад, раса) перетворюються у числовий формат.

Крок 3. Моделювання

Цей етап включає:

  • Вибір моделі залежно від типу задачі та експериментів;
  • Налаштування гіперпараметрів для підвищення ефективності;
  • Оцінювання моделі на невідомих даних.
Note
Дізнатися більше

Гіперпараметри — це налаштовувані параметри, які визначають процес навчання моделі, наприклад, тривалість навчання або складність моделі.

Приклад

Для прогнозування повторної госпіталізації (так/ні) обирається модель класифікації. Після налаштування вона оцінюється на валідаційній/тестовій вибірці для перевірки здатності до узагальнення.

Крок 4. Розгортання

Після досягнення належної якості модель розгортається у реальних системах. Необхідно здійснювати моніторинг моделі, оновлювати її новими даними та вдосконалювати з часом, часто починаючи цикл з Кроку 1.

Приклад

Модель інтегрується в систему лікарні для виявлення пацієнтів з високим ризиком під час госпіталізації, що допомагає персоналу діяти завчасно.

Note
Примітка

Деякі з термінів, згаданих тут, можуть здатися незнайомими, але ми розглянемо їх детальніше пізніше у цьому курсі.

Попередню обробку даних і моделювання можна виконувати за допомогою scikit-learn. У наступних розділах буде представлено робочі процеси попередньої обробки та конвеєри, а також моделювання із застосуванням методу найближчих сусідів (KNeighborsClassifier), включаючи навчання, налаштування та оцінювання.

1. Яка основна мета етапу "Отримання даних" у проєкті машинного навчання?

2. Яке з наведеного найкраще описує важливість етапу "Попередня обробка даних" у робочому процесі проєкту машинного навчання?

question mark

Яка основна мета етапу "Отримання даних" у проєкті машинного навчання?

Select the correct answer

question mark

Яке з наведеного найкраще описує важливість етапу "Попередня обробка даних" у робочому процесі проєкту машинного навчання?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 5

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain more about data preprocessing steps?

What is feature engineering and why is it important?

How does KNeighborsClassifier work in machine learning?

Awesome!

Completion rate improved to 3.13

bookРобочий процес машинного навчання

Свайпніть щоб показати меню

Розглянемо робочий процес, який необхідно пройти для створення успішного проєкту машинного навчання.

Крок 1. Отримання даних

Визначення задачі, вибір метрики ефективності та встановлення критеріїв для хорошого результату. Далі — збір необхідних даних із доступних джерел та приведення їх до формату, придатного для використання в Python. Якщо дані вже збережені у CSV-файлі, можна одразу переходити до попередньої обробки.

Приклад

Лікарня збирає записи пацієнтів та демографічні дані у CSV-файл. Мета — прогнозування повторних госпіталізацій з точністю понад 80%.

Крок 2. Попередня обробка даних

Цей етап включає:

  • Очищення даних: обробка пропущених значень і нечислових даних;
  • EDA: аналіз і візуалізація даних для виявлення зв'язків і проблем;
  • Фічерінженерія: вибір або створення ознак, що підвищують ефективність моделі.

Приклад

Пропущені значення (наприклад, артеріальний тиск) заповнюються, а категоріальні ознаки (наприклад, раса) перетворюються у числовий формат.

Крок 3. Моделювання

Цей етап включає:

  • Вибір моделі залежно від типу задачі та експериментів;
  • Налаштування гіперпараметрів для підвищення ефективності;
  • Оцінювання моделі на невідомих даних.
Note
Дізнатися більше

Гіперпараметри — це налаштовувані параметри, які визначають процес навчання моделі, наприклад, тривалість навчання або складність моделі.

Приклад

Для прогнозування повторної госпіталізації (так/ні) обирається модель класифікації. Після налаштування вона оцінюється на валідаційній/тестовій вибірці для перевірки здатності до узагальнення.

Крок 4. Розгортання

Після досягнення належної якості модель розгортається у реальних системах. Необхідно здійснювати моніторинг моделі, оновлювати її новими даними та вдосконалювати з часом, часто починаючи цикл з Кроку 1.

Приклад

Модель інтегрується в систему лікарні для виявлення пацієнтів з високим ризиком під час госпіталізації, що допомагає персоналу діяти завчасно.

Note
Примітка

Деякі з термінів, згаданих тут, можуть здатися незнайомими, але ми розглянемо їх детальніше пізніше у цьому курсі.

Попередню обробку даних і моделювання можна виконувати за допомогою scikit-learn. У наступних розділах буде представлено робочі процеси попередньої обробки та конвеєри, а також моделювання із застосуванням методу найближчих сусідів (KNeighborsClassifier), включаючи навчання, налаштування та оцінювання.

1. Яка основна мета етапу "Отримання даних" у проєкті машинного навчання?

2. Яке з наведеного найкраще описує важливість етапу "Попередня обробка даних" у робочому процесі проєкту машинного навчання?

question mark

Яка основна мета етапу "Отримання даних" у проєкті машинного навчання?

Select the correct answer

question mark

Яке з наведеного найкраще описує важливість етапу "Попередня обробка даних" у робочому процесі проєкту машинного навчання?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 5
some-alt