Основні поняття Scikit-learn
Свайпніть щоб показати меню
Бібліотека scikit-learn (sklearn) надає інструменти для попередньої обробки та моделювання. Основні типи об'єктів: estimator (оцінювач), transformer (трансформер), predictor (предиктор) та model (модель).
Estimator
Будь-який клас з методом .fit() є оцінювачем — він навчається на даних.
estimator.fit(X, y) # supervised
estimator.fit(X) # unsupervised
Трансформер
Трансформер має методи .fit() і .transform(), а також .fit_transform(), який виконує обидві дії одночасно.
Трансформери зазвичай використовуються для перетворення масиву X. Однак, як ми побачимо на прикладі LabelEncoder, деякі трансформери призначені для масиву y.
Значення nan, показані на тренувальному наборі на зображенні, вказують на відсутні дані в Python.
Предиктор
Предиктор — це оцінювач із методом .predict() для генерування вихідних даних.
predictor.fit(X, y)
predictor.predict(X_new)
Модель
Модель — це предиктор з методом .score(), який оцінює якість виконання.
model.fit(X, y)
model.score(X, y)
Як згадувалося у попередньому розділі, точність — це метрика, що відображає відсоток правильних передбачень.
Етап попередньої обробки включає роботу з трансформерами, а на етапі моделювання використовується робота з предикторами (точніше, з моделями).
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат