Uuden Sarakkeen Lisääminen
Olemme oppineet, kuinka luodaan DataFrame
. Nyt tutkitaan, mitä voimme tehdä sillä. Ensin luomme kompaktin DataFrame
:n, joka koostuu 3 sarakkeesta ja 7 rivistä.
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Voit laajentaa DataFramea lisäämällä uusia sarakkeita, ja yleisin tapa tehdä se on seuraava:
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
-
dataframe
on olemassa olevan DataFrame:n nimi, johon lisäämme uusia sarakkeita; -
name_of_new_column
on nimi, jonka annat uudelle sarakkeelle, jonka lisäät; -
value_1, value_2, value_3
ovat arvot, jotka täyttävät uuden sarakkeen.
Huomautus
Uuden sarakkeen nimi tulee olla lainausmerkeissä ja hakasulkeissa, kuten
['NewColumnName']
. Uudelle sarakkeelle annetut arvot tulee myös olla hakasulkeissa, esimerkiksidata['NewColumnName'] = [value1, value2, value3]
. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten[1, 2, 3]
. Jos arvot ovat merkkijonoja, jokainen tulee olla lainausmerkeissä, kuten['A', 'B', 'C']
.
Nyt lisäämme 'population'
-sarakkeen olemassa olevaan countries
DataFrameen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Voit myös käyttää piste-notaatiota (esim. df.column
) olemassa olevien sarakkeiden käyttämiseen, mutta sitä ei voida käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkeita (esim. df['column']
) tähän tarkoitukseen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Kuten odotettiin, 'population'
-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä lähestymistavalla.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.03
Uuden Sarakkeen Lisääminen
Pyyhkäise näyttääksesi valikon
Olemme oppineet, kuinka luodaan DataFrame
. Nyt tutkitaan, mitä voimme tehdä sillä. Ensin luomme kompaktin DataFrame
:n, joka koostuu 3 sarakkeesta ja 7 rivistä.
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Voit laajentaa DataFramea lisäämällä uusia sarakkeita, ja yleisin tapa tehdä se on seuraava:
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
-
dataframe
on olemassa olevan DataFrame:n nimi, johon lisäämme uusia sarakkeita; -
name_of_new_column
on nimi, jonka annat uudelle sarakkeelle, jonka lisäät; -
value_1, value_2, value_3
ovat arvot, jotka täyttävät uuden sarakkeen.
Huomautus
Uuden sarakkeen nimi tulee olla lainausmerkeissä ja hakasulkeissa, kuten
['NewColumnName']
. Uudelle sarakkeelle annetut arvot tulee myös olla hakasulkeissa, esimerkiksidata['NewColumnName'] = [value1, value2, value3]
. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten[1, 2, 3]
. Jos arvot ovat merkkijonoja, jokainen tulee olla lainausmerkeissä, kuten['A', 'B', 'C']
.
Nyt lisäämme 'population'
-sarakkeen olemassa olevaan countries
DataFrameen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Voit myös käyttää piste-notaatiota (esim. df.column
) olemassa olevien sarakkeiden käyttämiseen, mutta sitä ei voida käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkeita (esim. df['column']
) tähän tarkoitukseen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Kuten odotettiin, 'population'
-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä lähestymistavalla.
Kiitos palautteestasi!