Riempimento Dei Valori Mancanti
Eliminare i valori mancanti non è l'unico modo per gestirli. È anche possibile sostituire tutti i NaN con un valore definito, ad esempio con il valore medio della colonna o con zeri. Questa tecnica può risultare utile in molte situazioni. Verrà approfondita nel corso Learning Statistics with Python.
Si osservi l'esempio di riempimento dei valori mancanti nella colonna 'Age'
utilizzando il valore mediano di questa colonna:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Spiegazione:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
- tramite l'argomentovalue
, si indica al metodo.fillna()
come gestire i valoriNaN
. In questo caso, il metodo.fillna()
viene applicato alla colonna'Age'
e tutti i valori mancanti vengono sostituiti con la mediana della colonna;inplace=True
- argomento che consente di salvare le modifiche.
Swipe to start coding
Uno dei modi più comuni per riempire i valori mancanti è sostituirli con il valore medio della colonna. Quindi, il tuo compito qui è sostituire i valori NaN
nella colonna 'Age'
con il valore medio della colonna (utilizzando l'argomento inplace = True
). Successivamente, mostra la somma dei valori mancanti nella colonna 'Age'
.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Riempimento Dei Valori Mancanti
Scorri per mostrare il menu
Eliminare i valori mancanti non è l'unico modo per gestirli. È anche possibile sostituire tutti i NaN con un valore definito, ad esempio con il valore medio della colonna o con zeri. Questa tecnica può risultare utile in molte situazioni. Verrà approfondita nel corso Learning Statistics with Python.
Si osservi l'esempio di riempimento dei valori mancanti nella colonna 'Age'
utilizzando il valore mediano di questa colonna:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Spiegazione:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
- tramite l'argomentovalue
, si indica al metodo.fillna()
come gestire i valoriNaN
. In questo caso, il metodo.fillna()
viene applicato alla colonna'Age'
e tutti i valori mancanti vengono sostituiti con la mediana della colonna;inplace=True
- argomento che consente di salvare le modifiche.
Swipe to start coding
Uno dei modi più comuni per riempire i valori mancanti è sostituirli con il valore medio della colonna. Quindi, il tuo compito qui è sostituire i valori NaN
nella colonna 'Age'
con il valore medio della colonna (utilizzando l'argomento inplace = True
). Successivamente, mostra la somma dei valori mancanti nella colonna 'Age'
.
Soluzione
Grazie per i tuoi commenti!
single