Sfida: Imputazione dei Valori Mancanti
La classe SimpleImputer sostituisce automaticamente i valori mancanti.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Parametri principali:
missing_value: segnaposto considerato come mancante (predefinitonp.nan);strategy: metodo per colmare le lacune ('mean'di default);fill_value: utilizzato quandostrategy='constant'.
Come trasformatore, fornisce metodi come .fit(), .transform() e .fit_transform().
La scelta di come riempire i dati mancanti è fondamentale. Approccio comune:
- variabili numeriche → media;
- variabili categoriche → valore più frequente.
Opzioni per strategy:
'mean'— riempie con la media;'median'— riempie con la mediana;'most_frequent'— riempie con la moda;'constant'— riempie con un valore specificato tramitefill_value.
missing_values definisce quali valori sono considerati mancanti (predefinito NaN, ma può essere '' o un altro marcatore).
SimpleImputer si aspetta un DataFrame, non una Series.
Un DataFrame a singola colonna deve essere selezionato usando le doppie parentesi:
imputer.fit_transform(df[['column']])
fit_transform() restituisce un array 2D, ma l'assegnazione a una colonna di DataFrame richiede un array 1D.
Appiattire il risultato utilizzando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Ti viene fornito un DataFrame df contenente dati sui pinguini. La colonna 'sex' presenta valori mancanti. Riempili utilizzando la categoria più frequente.
- Importazione di
SimpleImputer; - Creazione di un imputer con
strategy='most_frequent'; - Applicazione all'oggetto
df[['sex']]; - Assegnazione dei valori imputati nuovamente a
df['sex'].
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.13
Sfida: Imputazione dei Valori Mancanti
Scorri per mostrare il menu
La classe SimpleImputer sostituisce automaticamente i valori mancanti.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Parametri principali:
missing_value: segnaposto considerato come mancante (predefinitonp.nan);strategy: metodo per colmare le lacune ('mean'di default);fill_value: utilizzato quandostrategy='constant'.
Come trasformatore, fornisce metodi come .fit(), .transform() e .fit_transform().
La scelta di come riempire i dati mancanti è fondamentale. Approccio comune:
- variabili numeriche → media;
- variabili categoriche → valore più frequente.
Opzioni per strategy:
'mean'— riempie con la media;'median'— riempie con la mediana;'most_frequent'— riempie con la moda;'constant'— riempie con un valore specificato tramitefill_value.
missing_values definisce quali valori sono considerati mancanti (predefinito NaN, ma può essere '' o un altro marcatore).
SimpleImputer si aspetta un DataFrame, non una Series.
Un DataFrame a singola colonna deve essere selezionato usando le doppie parentesi:
imputer.fit_transform(df[['column']])
fit_transform() restituisce un array 2D, ma l'assegnazione a una colonna di DataFrame richiede un array 1D.
Appiattire il risultato utilizzando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Ti viene fornito un DataFrame df contenente dati sui pinguini. La colonna 'sex' presenta valori mancanti. Riempili utilizzando la categoria più frequente.
- Importazione di
SimpleImputer; - Creazione di un imputer con
strategy='most_frequent'; - Applicazione all'oggetto
df[['sex']]; - Assegnazione dei valori imputati nuovamente a
df['sex'].
Soluzione
Grazie per i tuoi commenti!
single