Het Invullen van de Ontbrekende Waarden
Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Statistiek leren met Python.
Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age'
met de mediaanwaarde van deze kolom:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Uitleg:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
- met het argumentvalue
geven we aan de.fillna()
-methode door wat er met deNaN
-waarden moet gebeuren. In dit geval passen we de.fillna()
-methode toe op de kolom'Age'
en vervangen we alle ontbrekende waarden door de mediaan van de kolom;inplace=True
- het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Swipe to start coding
Een van de meest voorkomende methoden om ontbrekende waarden op te vullen, is het vervangen ervan door de gemiddelde waarde van de kolom. Je taak is hier om de NaN
-waarden in de kolom 'Age'
te vervangen door de gemiddelde waarde van de kolom (met gebruik van het argument inplace = True
). Geef daarna de som van de ontbrekende waarden in de kolom 'Age'
weer.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Het Invullen van de Ontbrekende Waarden
Veeg om het menu te tonen
Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Statistiek leren met Python.
Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age'
met de mediaanwaarde van deze kolom:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Uitleg:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
- met het argumentvalue
geven we aan de.fillna()
-methode door wat er met deNaN
-waarden moet gebeuren. In dit geval passen we de.fillna()
-methode toe op de kolom'Age'
en vervangen we alle ontbrekende waarden door de mediaan van de kolom;inplace=True
- het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Swipe to start coding
Een van de meest voorkomende methoden om ontbrekende waarden op te vullen, is het vervangen ervan door de gemiddelde waarde van de kolom. Je taak is hier om de NaN
-waarden in de kolom 'Age'
te vervangen door de gemiddelde waarde van de kolom (met gebruik van het argument inplace = True
). Geef daarna de som van de ontbrekende waarden in de kolom 'Age'
weer.
Oplossing
Bedankt voor je feedback!
single