Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Het Invullen van de Ontbrekende Waarden | Gegevens Preprocessen
Geavanceerde Technieken in Pandas

bookHet Invullen van de Ontbrekende Waarden

Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Statistiek leren met Python.

Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age' met de mediaanwaarde van deze kolom:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Uitleg:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() - met het argument value geven we aan de .fillna()-methode door wat er met de NaN-waarden moet gebeuren. In dit geval passen we de .fillna()-methode toe op de kolom 'Age' en vervangen we alle ontbrekende waarden door de mediaan van de kolom;
  • inplace=True - het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Taak

Swipe to start coding

Een van de meest voorkomende methoden om ontbrekende waarden op te vullen, is het vervangen ervan door de gemiddelde waarde van de kolom. Je taak is hier om de NaN-waarden in de kolom 'Age' te vervangen door de gemiddelde waarde van de kolom (met gebruik van het argument inplace = True). Geef daarna de som van de ontbrekende waarden in de kolom 'Age' weer.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain the difference between using the mean and the median to fill missing values?

What are some other strategies for handling missing data?

Can you show how to fill missing values in multiple columns at once?

close

Awesome!

Completion rate improved to 3.03

bookHet Invullen van de Ontbrekende Waarden

Veeg om het menu te tonen

Het verwijderen van ontbrekende waarden is niet de enige manier om ervan af te komen. Je kunt ook alle NaN's vervangen door een gedefinieerde waarde, bijvoorbeeld door de gemiddelde waarde van de kolom of door nullen. Dit kan in veel gevallen nuttig zijn. Je leert dit in de cursus Statistiek leren met Python.

Bekijk het voorbeeld van het invullen van ontbrekende waarden in de kolom 'Age' met de mediaanwaarde van deze kolom:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Uitleg:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() - met het argument value geven we aan de .fillna()-methode door wat er met de NaN-waarden moet gebeuren. In dit geval passen we de .fillna()-methode toe op de kolom 'Age' en vervangen we alle ontbrekende waarden door de mediaan van de kolom;
  • inplace=True - het argument dat we kunnen gebruiken om wijzigingen op te slaan.
Taak

Swipe to start coding

Een van de meest voorkomende methoden om ontbrekende waarden op te vullen, is het vervangen ervan door de gemiddelde waarde van de kolom. Je taak is hier om de NaN-waarden in de kolom 'Age' te vervangen door de gemiddelde waarde van de kolom (met gebruik van het argument inplace = True). Geef daarna de som van de ontbrekende waarden in de kolom 'Age' weer.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5
single

single

some-alt