Tilføjelse af en Ny Kolonne
Vi har lært, hvordan man opretter en DataFrame
. Lad os nu udforske, hvad vi kan gøre med den. Først opretter vi en kompakt DataFrame
, der består af 3 kolonner og 7 rækker.
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Du kan udvide DataFrame ved at tilføje nye kolonner, og den mest almindelige måde at gøre det på er som følger:
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
-
dataframe
er navnet på vores eksisterende DataFrame, som vi vil tilføje nye kolonner til; -
name_of_new_column
er navnet, du giver til den nye kolonne, du tilføjer; -
value_1, value_2, value_3
er de værdier, der vil udfylde den nye kolonne.
Bemærk
Navnet på den nye kolonne skal være omsluttet af anførselstegn og indrammet i kantede parenteser, såsom
['NewColumnName']
. Værdierne tildelt den nye kolonne skal også være inden for kantede parenteser, for eksempel,data['NewColumnName'] = [value1, value2, value3]
. Hvis værdierne er numeriske, kan de skrives uden anførselstegn, som[1, 2, 3]
. Hvis værdierne er strenge, skal hver være omsluttet af anførselstegn, som['A', 'B', 'C']
.
Nu vil vi tilføje en 'population'
kolonne til vores allerede eksisterende countries
DataFrame.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Du kan også bruge punktnotation (f.eks. df.column
) til at få adgang til eksisterende kolonner, men det kan ikke bruges til at oprette nye kolonner. Brug altid firkantede parenteser (f.eks. df['column']
) til dette formål.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Som forventet blev 'population'
kolonnen ikke oprettet, da Pandas ikke tillader kolonner at blive oprettet ved hjælp af denne tilgang.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.03
Tilføjelse af en Ny Kolonne
Stryg for at vise menuen
Vi har lært, hvordan man opretter en DataFrame
. Lad os nu udforske, hvad vi kan gøre med den. Først opretter vi en kompakt DataFrame
, der består af 3 kolonner og 7 rækker.
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Du kan udvide DataFrame ved at tilføje nye kolonner, og den mest almindelige måde at gøre det på er som følger:
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
-
dataframe
er navnet på vores eksisterende DataFrame, som vi vil tilføje nye kolonner til; -
name_of_new_column
er navnet, du giver til den nye kolonne, du tilføjer; -
value_1, value_2, value_3
er de værdier, der vil udfylde den nye kolonne.
Bemærk
Navnet på den nye kolonne skal være omsluttet af anførselstegn og indrammet i kantede parenteser, såsom
['NewColumnName']
. Værdierne tildelt den nye kolonne skal også være inden for kantede parenteser, for eksempel,data['NewColumnName'] = [value1, value2, value3]
. Hvis værdierne er numeriske, kan de skrives uden anførselstegn, som[1, 2, 3]
. Hvis værdierne er strenge, skal hver være omsluttet af anførselstegn, som['A', 'B', 'C']
.
Nu vil vi tilføje en 'population'
kolonne til vores allerede eksisterende countries
DataFrame.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Du kan også bruge punktnotation (f.eks. df.column
) til at få adgang til eksisterende kolonner, men det kan ikke bruges til at oprette nye kolonner. Brug altid firkantede parenteser (f.eks. df['column']
) til dette formål.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Som forventet blev 'population'
kolonnen ikke oprettet, da Pandas ikke tillader kolonner at blive oprettet ved hjælp af denne tilgang.
Tak for dine kommentarer!