Het Invullen van de Ontbrekende Waarden
Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Learning Statistics with Python.
Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age' met de mediaan van deze kolom:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Uitleg:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()- met het argumentvaluegeven we aan de.fillna()-methode door wat er met deNaN-waarden moet gebeuren. In dit geval passen we de.fillna()-methode toe op de kolom'Age'en vervangen we alle ontbrekende waarden door de mediaan van de kolom;inplace=True- het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Swipe to start coding
Ontbrekende waarden kunnen problemen veroorzaken bij het analyseren van data. Een van de meest gebruikte methoden om hiermee om te gaan is het vervangen van ontbrekende waarden door het gemiddelde van de kolom.
Uw opdracht is:
- Vervang alle
NaN-waarden in de kolom'Age'door het gemiddelde van die kolom.
- Gebruik de methode
.fillna()met de argumentenvalue=data['Age'].mean()eninplace=True.
- Bereken en print het aantal resterende ontbrekende waarden in de kolom
'Age'.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.03
Het Invullen van de Ontbrekende Waarden
Veeg om het menu te tonen
Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Learning Statistics with Python.
Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age' met de mediaan van deze kolom:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Uitleg:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()- met het argumentvaluegeven we aan de.fillna()-methode door wat er met deNaN-waarden moet gebeuren. In dit geval passen we de.fillna()-methode toe op de kolom'Age'en vervangen we alle ontbrekende waarden door de mediaan van de kolom;inplace=True- het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Swipe to start coding
Ontbrekende waarden kunnen problemen veroorzaken bij het analyseren van data. Een van de meest gebruikte methoden om hiermee om te gaan is het vervangen van ontbrekende waarden door het gemiddelde van de kolom.
Uw opdracht is:
- Vervang alle
NaN-waarden in de kolom'Age'door het gemiddelde van die kolom.
- Gebruik de methode
.fillna()met de argumentenvalue=data['Age'].mean()eninplace=True.
- Bereken en print het aantal resterende ontbrekende waarden in de kolom
'Age'.
Oplossing
Bedankt voor je feedback!
single