Завдання: Заповнення Пропущених Значень
SimpleImputer автоматично замінює відсутні значення.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Основні параметри:
missing_value: позначення, яке вважається відсутнім (типовоnp.nan);strategy: спосіб заповнення пропусків (типово'mean');fill_value: використовується, якщоstrategy='constant'.
Як трансформер, надає методи .fit(), .transform() та .fit_transform().
Вибір способу заповнення пропущених даних є важливим. Поширений підхід:
- числові ознаки → середнє значення;
- категоріальні ознаки → найчастіше значення.
Опції параметра strategy:
'mean'— заповнення середнім значенням;'median'— заповнення медіаною;'most_frequent'— заповнення модою;'constant'— заповнення вказаним значенням черезfill_value.
missing_values визначає, які значення вважаються відсутніми (типово NaN, але може бути '' або інший маркер).
SimpleImputer очікує DataFrame, а не Series.
Одноколонковий DataFrame потрібно вибирати за допомогою подвійних дужок:
imputer.fit_transform(df[['column']])
fit_transform() повертає 2D-масив, але для присвоєння значення стовпцю DataFrame потрібен 1D-масив.
Використайте .ravel() для перетворення результату:
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Вам надано DataFrame df з даними про пінгвінів. У стовпці 'sex' є пропущені значення. Заповніть їх, використовуючи найчастішу категорію.
- Імпортуйте
SimpleImputer; - Створіть імпутер з параметром
strategy='most_frequent'; - Застосуйте його до
df[['sex']]; - Призначте імпутовані значення назад у
df['sex'].
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Чудово!
Completion показник покращився до 4.55
Завдання: Заповнення Пропущених Значень
Свайпніть щоб показати меню
SimpleImputer автоматично замінює відсутні значення.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Основні параметри:
missing_value: позначення, яке вважається відсутнім (типовоnp.nan);strategy: спосіб заповнення пропусків (типово'mean');fill_value: використовується, якщоstrategy='constant'.
Як трансформер, надає методи .fit(), .transform() та .fit_transform().
Вибір способу заповнення пропущених даних є важливим. Поширений підхід:
- числові ознаки → середнє значення;
- категоріальні ознаки → найчастіше значення.
Опції параметра strategy:
'mean'— заповнення середнім значенням;'median'— заповнення медіаною;'most_frequent'— заповнення модою;'constant'— заповнення вказаним значенням черезfill_value.
missing_values визначає, які значення вважаються відсутніми (типово NaN, але може бути '' або інший маркер).
SimpleImputer очікує DataFrame, а не Series.
Одноколонковий DataFrame потрібно вибирати за допомогою подвійних дужок:
imputer.fit_transform(df[['column']])
fit_transform() повертає 2D-масив, але для присвоєння значення стовпцю DataFrame потрібен 1D-масив.
Використайте .ravel() для перетворення результату:
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Вам надано DataFrame df з даними про пінгвінів. У стовпці 'sex' є пропущені значення. Заповніть їх, використовуючи найчастішу категорію.
- Імпортуйте
SimpleImputer; - Створіть імпутер з параметром
strategy='most_frequent'; - Застосуйте його до
df[['sex']]; - Призначте імпутовані значення назад у
df['sex'].
Рішення
Дякуємо за ваш відгук!
single