Wat Zullen We Doen Met de NaN-Waarden?
In het vorige hoofdstuk ontving je het volgende resultaat:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
De dataset bevat 418 rijen. Kijk naar de kolom Cabin
, waar 327
ontbrekende waarden zijn. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen waarde heeft. Een van de redenen is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.
Om een kolom te verwijderen, moet je de methode .drop()
toepassen op de dataset. De syntax is als volgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Uitleg:
.drop()
- een methode die kolommen verwijdert;columns = 'column_name'
ofcolumns = ['column_1', 'column_2']
- argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;inplace = True
- nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele leren.
Swipe to start coding
Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:
- Verwijder de kolom
'Cabin'
met behulp van het argumentinplace = True
. - Toon willekeurig
5
rijen uit de dataset.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.03
Wat Zullen We Doen Met de NaN-Waarden?
Veeg om het menu te tonen
In het vorige hoofdstuk ontving je het volgende resultaat:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
De dataset bevat 418 rijen. Kijk naar de kolom Cabin
, waar 327
ontbrekende waarden zijn. Het heeft geen zin om deze in te vullen, omdat we hier minimale informatie hebben. In dit geval is de beste oplossing om de kolom te verwijderen die voor ons geen waarde heeft. Een van de redenen is dat we alleen de rijen met ontbrekende waarden kunnen verwijderen, maar we kunnen niet 327 van de 418 rijen verwijderen. Laten we dus bekijken hoe we dit kunnen doen.
Om een kolom te verwijderen, moet je de methode .drop()
toepassen op de dataset. De syntax is als volgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Uitleg:
.drop()
- een methode die kolommen verwijdert;columns = 'column_name'
ofcolumns = ['column_1', 'column_2']
- argument van de functie, waarin je de naam of namen van de kolommen opgeeft die je wilt verwijderen;inplace = True
- nuttig argument van pandas waarmee alle wijzigingen worden opgeslagen. Je kunt dit ook in andere functies gebruiken; we zullen er later enkele leren.
Swipe to start coding
Uw taak is om de kolom met het grootste aantal NaN-waarden te verwijderen. Volg het algoritme:
- Verwijder de kolom
'Cabin'
met behulp van het argumentinplace = True
. - Toon willekeurig
5
rijen uit de dataset.
Oplossing
Bedankt voor je feedback!
single