Een Rij/Kolom Verwijderen
Soms bieden bepaalde kolommen geen waardevolle informatie, waardoor het voordelig kan zijn om ze te verwijderen. De pandas
bibliotheek biedt de drop()
methode voor dit doel.
python
index
: specificeert de rij-indexen die moeten worden verwijderd (gebruikt wanneeraxis=0
);columns
: identificeert de kolomnamen die moeten worden verwijderd (gebruikt wanneeraxis=1
);axis
: kies of u labels wilt verwijderen uit de rijen (0
) of kolommen (1
). De standaardwaarde is0
.
We beginnen met het onderzoeken van de DataFrame:
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : [None, None, 'Europe', None, 'Europe', None, 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
We merken op dat de 'continent'
kolom veel ontbrekende waarden bevat, waardoor deze minder informatief is. Daarom zullen we deze verwijderen.
import pandas countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : [None, None, 'Europe', None, 'Europe', None, 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pandas.DataFrame(countries_data) countries = countries.drop(columns = ['continent'],axis=1) print(countries)
Taak
Swipe to start coding
Je hebt een DataFrame
genaamd audi_cars
.
- Verwijder de kolom
'capital'
en sla het resulterendeDataFrame
op in de variabeleaudi_cars
.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 1. Hoofdstuk 9