Riempimento Dei Valori Mancanti
Eliminare i valori mancanti non è l'unico modo per gestirli. È anche possibile sostituire tutti i NaN con un valore definito, ad esempio con il valore medio della colonna o con zeri. Questa tecnica può essere utile in molti casi. Imparerai questo argomento nel corso Learning Statistics with Python.
Osserva l'esempio di riempimento dei valori mancanti nella colonna 'Age' con il valore mediano di questa colonna:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Spiegazione:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()- utilizzando l'argomentovalue, si indica al metodo.fillna()come gestire i valoriNaN. In questo caso, il metodo.fillna()viene applicato alla colonna'Age'e tutti i valori mancanti vengono sostituiti con la mediana della colonna;inplace=True- argomento che consente di salvare le modifiche.
Swipe to start coding
I valori mancanti possono causare problemi durante l'analisi dei dati. Uno dei modi più comuni per gestirli è sostituire i valori mancanti con la media della colonna.
Il tuo compito è:
- Sostituire tutti i valori
NaNnella colonna'Age'con la media di quella colonna.
- Utilizza il metodo
.fillna()con gli argomentivalue=data['Age'].mean()einplace=True.
- Calcolare e stampare il numero di valori mancanti rimanenti nella colonna
'Age'.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Fantastico!
Completion tasso migliorato a 3.03
Riempimento Dei Valori Mancanti
Scorri per mostrare il menu
Eliminare i valori mancanti non è l'unico modo per gestirli. È anche possibile sostituire tutti i NaN con un valore definito, ad esempio con il valore medio della colonna o con zeri. Questa tecnica può essere utile in molti casi. Imparerai questo argomento nel corso Learning Statistics with Python.
Osserva l'esempio di riempimento dei valori mancanti nella colonna 'Age' con il valore mediano di questa colonna:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Spiegazione:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()- utilizzando l'argomentovalue, si indica al metodo.fillna()come gestire i valoriNaN. In questo caso, il metodo.fillna()viene applicato alla colonna'Age'e tutti i valori mancanti vengono sostituiti con la mediana della colonna;inplace=True- argomento che consente di salvare le modifiche.
Swipe to start coding
I valori mancanti possono causare problemi durante l'analisi dei dati. Uno dei modi più comuni per gestirli è sostituire i valori mancanti con la media della colonna.
Il tuo compito è:
- Sostituire tutti i valori
NaNnella colonna'Age'con la media di quella colonna.
- Utilizza il metodo
.fillna()con gli argomentivalue=data['Age'].mean()einplace=True.
- Calcolare e stampare il numero di valori mancanti rimanenti nella colonna
'Age'.
Soluzione
Grazie per i tuoi commenti!
single