Kursinnhold
Pandas Første Steg
Pandas Første Steg
Legge til en Ny Kolonne
Vi har lært hvordan vi oppretter en DataFrame
. Nå skal vi utforske hva vi kan gjøre med den. Først skal vi lage en kompakt DataFrame
bestående av 3 kolonner og 7 rader.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Du kan utvide DataFrame ved å legge til nye kolonner, og den vanligste måten å gjøre det på er som følger:
python
dataframe
er navnet på vår eksisterende DataFrame som vi skal legge til nye kolonner i;name_of_new_column
er navnet du gir til den nye kolonnen du legger til;value_1, value_2, value_3
er verdiene som vil fylle den nye kolonnen.
Merk
Navnet på den nye kolonnen skal være omsluttet av anførselstegn og pakket inn i hakeparenteser, slik som
['NewColumnName']
. Verdiene som tildeles den nye kolonnen skal også være innenfor hakeparenteser, for eksempel,data['NewColumnName'] = [value1, value2, value3]
. Hvis verdiene er numeriske, kan de skrives uten anførselstegn, som[1, 2, 3]
. Hvis verdiene er strenger, skal hver enkelt være omsluttet av anførselstegn, som['A', 'B', 'C']
.
Nå skal vi legge til en 'population'
kolonne til vår allerede eksisterende countries
DataFrame.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Du kan også bruke punktnotasjon (f.eks., df.column
) for å få tilgang til eksisterende kolonner, men den kan ikke brukes til å opprette nye kolonner. Bruk alltid hakeparenteser (f.eks., df['column']
) for dette formålet.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Som forventet ble ikke 'population'
-kolonnen opprettet siden Pandas ikke tillater at kolonner opprettes ved hjelp av denne metoden.
Takk for tilbakemeldingene dine!