Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Wat Zullen We Doen Met De NaN-Waarden? | Gegevens Preprocessen
Geavanceerde Technieken in Pandas

bookWat Zullen We Doen Met De NaN-Waarden?

In het vorige hoofdstuk ontving je het volgende resultaat:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

De dataset bevat 418 rijen. Bekijk de kolom Cabin, waarin zich 327 ontbrekende waarden bevinden. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen betekenis heeft. Een van de redenen hiervoor is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.

Om een kolom te verwijderen, moet je de methode .drop() toepassen op de dataset. De syntaxis is als volgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Toelichting:

  • .drop() - een methode die kolommen verwijdert;
  • columns = 'column_name' of columns = ['column_1', 'column_2'] - argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;
  • inplace = True - nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele van leren.
Taak

Swipe to start coding

Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:

  1. Verwijder de kolom 'Cabin' met behulp van het argument inplace = True.
  2. Geef willekeurig 5 rijen van de dataset weer.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 3
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain what happens if I don't use `inplace=True`?

What should I do if I want to delete multiple columns at once?

Is there a way to undo the column deletion if I make a mistake?

close

Awesome!

Completion rate improved to 3.03

bookWat Zullen We Doen Met De NaN-Waarden?

Veeg om het menu te tonen

In het vorige hoofdstuk ontving je het volgende resultaat:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

De dataset bevat 418 rijen. Bekijk de kolom Cabin, waarin zich 327 ontbrekende waarden bevinden. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen betekenis heeft. Een van de redenen hiervoor is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.

Om een kolom te verwijderen, moet je de methode .drop() toepassen op de dataset. De syntaxis is als volgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Toelichting:

  • .drop() - een methode die kolommen verwijdert;
  • columns = 'column_name' of columns = ['column_1', 'column_2'] - argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;
  • inplace = True - nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele van leren.
Taak

Swipe to start coding

Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:

  1. Verwijder de kolom 'Cabin' met behulp van het argument inplace = True.
  2. Geef willekeurig 5 rijen van de dataset weer.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 3
single

single

some-alt