Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Het Invullen van de Ontbrekende Waarden | Gegevens Preprocessen
Geavanceerde Technieken in Pandas

bookHet Invullen van de Ontbrekende Waarden

Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Learning Statistics with Python.

Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age' met de mediaan van deze kolom:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Uitleg:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() - met het argument value geven we aan de .fillna()-methode door wat er met de NaN-waarden moet gebeuren. In dit geval passen we de .fillna()-methode toe op de kolom 'Age' en vervangen we alle ontbrekende waarden door de mediaan van de kolom;
  • inplace=True - het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Taak

Swipe to start coding

Ontbrekende waarden kunnen problemen veroorzaken bij het analyseren van data. Een van de meest gebruikte methoden om hiermee om te gaan is het vervangen van ontbrekende waarden door het gemiddelde van de kolom.

Uw opdracht is:

  1. Vervang alle NaN-waarden in de kolom 'Age' door het gemiddelde van die kolom.
  • Gebruik de methode .fillna() met de argumenten value=data['Age'].mean() en inplace=True.
  1. Bereken en print het aantal resterende ontbrekende waarden in de kolom 'Age'.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 3.03

bookHet Invullen van de Ontbrekende Waarden

Veeg om het menu te tonen

Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Learning Statistics with Python.

Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age' met de mediaan van deze kolom:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Uitleg:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() - met het argument value geven we aan de .fillna()-methode door wat er met de NaN-waarden moet gebeuren. In dit geval passen we de .fillna()-methode toe op de kolom 'Age' en vervangen we alle ontbrekende waarden door de mediaan van de kolom;
  • inplace=True - het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Taak

Swipe to start coding

Ontbrekende waarden kunnen problemen veroorzaken bij het analyseren van data. Een van de meest gebruikte methoden om hiermee om te gaan is het vervangen van ontbrekende waarden door het gemiddelde van de kolom.

Uw opdracht is:

  1. Vervang alle NaN-waarden in de kolom 'Age' door het gemiddelde van die kolom.
  • Gebruik de methode .fillna() met de argumenten value=data['Age'].mean() en inplace=True.
  1. Bereken en print het aantal resterende ontbrekende waarden in de kolom 'Age'.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5
single

single

some-alt