Hva Skal Vi Gjøre Med NaN-verdiene?
I forrige kapittel fikk du følgende resultat:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Datasettet har 418 rader. Se på kolonnen Cabin
, hvor vi har 327
manglende verdier. Det gir ingen mening å fylle dem inn fordi vi har minimal informasjon her. I dette tilfellet er den beste løsningen å slette kolonnen som er meningsløs for oss. En av grunnene er at vi kan slette bare radene som inneholder manglende verdier, men vi kan ikke slette 327 rader av 418. La oss derfor finne ut hvordan vi gjør dette.
For å slette en kolonne må du bruke metoden .drop()
på datasettet. Syntaksen er følgende:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Forklaring:
.drop()
– en metode som sletter kolonner;columns = 'column_name'
ellercolumns = ['column_1', 'column_2']
– argument for funksjonen, hvor du angir navnet eller navnene på kolonnene du vil slette;inplace = True
– nyttig argument i pandas som lar oss lagre alle endringer. Du kan bruke det i andre funksjoner også; vi skal lære om noen av dem senere.
Swipe to start coding
Din oppgave er å slette kolonnen med flest NaN-verdier. Følg algoritmen:
- Slett kolonnen
'Cabin'
ved å bruke argumentetinplace = True
. - Vis
5
tilfeldige rader fra datasettet.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.03
Hva Skal Vi Gjøre Med NaN-verdiene?
Sveip for å vise menyen
I forrige kapittel fikk du følgende resultat:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Datasettet har 418 rader. Se på kolonnen Cabin
, hvor vi har 327
manglende verdier. Det gir ingen mening å fylle dem inn fordi vi har minimal informasjon her. I dette tilfellet er den beste løsningen å slette kolonnen som er meningsløs for oss. En av grunnene er at vi kan slette bare radene som inneholder manglende verdier, men vi kan ikke slette 327 rader av 418. La oss derfor finne ut hvordan vi gjør dette.
For å slette en kolonne må du bruke metoden .drop()
på datasettet. Syntaksen er følgende:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Forklaring:
.drop()
– en metode som sletter kolonner;columns = 'column_name'
ellercolumns = ['column_1', 'column_2']
– argument for funksjonen, hvor du angir navnet eller navnene på kolonnene du vil slette;inplace = True
– nyttig argument i pandas som lar oss lagre alle endringer. Du kan bruke det i andre funksjoner også; vi skal lære om noen av dem senere.
Swipe to start coding
Din oppgave er å slette kolonnen med flest NaN-verdier. Følg algoritmen:
- Slett kolonnen
'Cabin'
ved å bruke argumentetinplace = True
. - Vis
5
tilfeldige rader fra datasettet.
Løsning
Takk for tilbakemeldingene dine!
single