Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Wat Zullen We Doen Met de NaN-Waarden? | Gegevens Preprocessen
Geavanceerde Technieken in Pandas

bookWat Zullen We Doen Met de NaN-Waarden?

In het vorige hoofdstuk ontving je het volgende resultaat:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

De dataset bevat 418 rijen. Kijk naar de kolom Cabin, waar 327 ontbrekende waarden zijn. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen waarde heeft. Een van de redenen is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.

Om een kolom te verwijderen, moet je de methode .drop() toepassen op de dataset. De syntax is als volgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Uitleg:

  • .drop() - een methode die kolommen verwijdert;
  • columns = 'column_name' of columns = ['column_1', 'column_2'] - argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;
  • inplace = True - nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele leren.
Taak

Swipe to start coding

Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:

  1. Verwijder de kolom 'Cabin' met behulp van het argument inplace = True.
  2. Toon willekeurig 5 rijen uit de dataset.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 3
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 3.03

bookWat Zullen We Doen Met de NaN-Waarden?

Veeg om het menu te tonen

In het vorige hoofdstuk ontving je het volgende resultaat:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

De dataset bevat 418 rijen. Kijk naar de kolom Cabin, waar 327 ontbrekende waarden zijn. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen waarde heeft. Een van de redenen is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.

Om een kolom te verwijderen, moet je de methode .drop() toepassen op de dataset. De syntax is als volgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Uitleg:

  • .drop() - een methode die kolommen verwijdert;
  • columns = 'column_name' of columns = ['column_1', 'column_2'] - argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;
  • inplace = True - nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele leren.
Taak

Swipe to start coding

Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:

  1. Verwijder de kolom 'Cabin' met behulp van het argument inplace = True.
  2. Toon willekeurig 5 rijen uit de dataset.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 3
single

single

some-alt