Wat Zullen We Doen Met De NaN-Waarden?
In het vorige hoofdstuk ontving je het volgende resultaat:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
De dataset bevat 418 rijen. Bekijk de kolom Cabin, waarin zich 327 ontbrekende waarden bevinden. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen betekenis heeft. Een van de redenen hiervoor is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.
Om een kolom te verwijderen, moet je de methode .drop() toepassen op de dataset. De syntaxis is als volgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Toelichting:
.drop()- een methode die kolommen verwijdert;columns = 'column_name'ofcolumns = ['column_1', 'column_2']- argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;inplace = True- nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele van leren.
Swipe to start coding
Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:
- Verwijder de kolom
'Cabin'met behulp van het argumentinplace = True. - Geef willekeurig
5rijen van de dataset weer.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Can you explain what happens if I don't use `inplace=True`?
What should I do if I want to delete multiple columns at once?
Is there a way to undo the column deletion if I make a mistake?
Awesome!
Completion rate improved to 3.03
Wat Zullen We Doen Met De NaN-Waarden?
Veeg om het menu te tonen
In het vorige hoofdstuk ontving je het volgende resultaat:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
De dataset bevat 418 rijen. Bekijk de kolom Cabin, waarin zich 327 ontbrekende waarden bevinden. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen betekenis heeft. Een van de redenen hiervoor is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.
Om een kolom te verwijderen, moet je de methode .drop() toepassen op de dataset. De syntaxis is als volgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Toelichting:
.drop()- een methode die kolommen verwijdert;columns = 'column_name'ofcolumns = ['column_1', 'column_2']- argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;inplace = True- nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele van leren.
Swipe to start coding
Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:
- Verwijder de kolom
'Cabin'met behulp van het argumentinplace = True. - Geef willekeurig
5rijen van de dataset weer.
Oplossing
Bedankt voor je feedback!
single