Kursusindhold
Pandas Første Skridt
Pandas Første Skridt
Tilføjelse af en Ny Kolonne
Vi har lært, hvordan man opretter en DataFrame
. Lad os nu udforske, hvad vi kan gøre med den. Først opretter vi en kompakt DataFrame
, der består af 3 kolonner og 7 rækker.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Du kan udvide DataFrame ved at tilføje nye kolonner, og den mest almindelige måde at gøre det på er som følger:
python
dataframe
er navnet på vores eksisterende DataFrame, som vi vil tilføje nye kolonner til;name_of_new_column
er navnet, du giver til den nye kolonne, du tilføjer;value_1, value_2, value_3
er de værdier, der vil udfylde den nye kolonne.
Bemærk
Navnet på den nye kolonne skal være omsluttet af anførselstegn og indrammet i kantede parenteser, såsom
['NewColumnName']
. Værdierne tildelt den nye kolonne skal også være inden for kantede parenteser, for eksempel,data['NewColumnName'] = [value1, value2, value3]
. Hvis værdierne er numeriske, kan de skrives uden anførselstegn, som[1, 2, 3]
. Hvis værdierne er strenge, skal hver være omsluttet af anførselstegn, som['A', 'B', 'C']
.
Nu vil vi tilføje en 'population'
kolonne til vores allerede eksisterende countries
DataFrame.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Du kan også bruge punktnotation (f.eks. df.column
) til at få adgang til eksisterende kolonner, men det kan ikke bruges til at oprette nye kolonner. Brug altid firkantede parenteser (f.eks. df['column']
) til dette formål.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Som forventet blev 'population'
kolonnen ikke oprettet, da Pandas ikke tillader kolonner at blive oprettet ved hjælp af denne tilgang.
Tak for dine kommentarer!