Чудово!
Completion показник покращився до 3.13single
Завдання: Заповнення Пропущених Значень
Свайпніть щоб показати меню
Клас SimpleImputer автоматично замінює відсутні значення.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Основні параметри:
missing_value: позначення, яке вважається відсутнім (типовоnp.nan);strategy: метод заповнення пропусків (типово'mean');fill_value: використовується, якщоstrategy='constant'.
Як трансформер, надає методи .fit(), .transform(), та .fit_transform().
Вибір способу заповнення відсутніх даних є важливим. Поширений підхід:
- числові ознаки → середнє значення;
- категоріальні ознаки → найчастіше значення.
Опції параметра strategy:
'mean'— заповнення середнім значенням;'median'— заповнення медіаною;'most_frequent'— заповнення модою;'constant'— заповнення вказаним значенням черезfill_value.
missing_values визначає, які значення вважаються відсутніми (типово NaN, але може бути '' або інший маркер).
SimpleImputer очікує DataFrame, а не Series.
Для вибору DataFrame з одним стовпцем слід використовувати подвійні дужки:
imputer.fit_transform(df[['column']])
fit_transform() повертає 2D-масив, але для присвоєння значення назад у стовпець DataFrame потрібен 1D-масив.
Використайте .ravel() для перетворення результату:
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Вам надано DataFrame df з даними про пінгвінів. У стовпці 'sex' є пропущені значення. Заповніть їх, використовуючи найчастішу категорію.
- Імпортуйте
SimpleImputer; - Створіть імпутер зі стратегією
strategy='most_frequent'; - Застосуйте його до
df[['sex']]; - Призначте імпутовані значення назад у
df['sex'].
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат