Uuden Sarakkeen Lisääminen
Olemme oppineet, kuinka luodaan DataFrame
. Nyt tutkitaan, mitä voimme tehdä sillä. Ensin luomme kompaktin DataFrame
:n, joka koostuu 3 sarakkeesta ja 7 rivistä.
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Voit laajentaa DataFramea lisäämällä uusia sarakkeita, ja yleisin tapa tehdä se on seuraava:
pythondataframe['name_of_new_column'] = [value_1, value_2, value_3]
dataframe
on olemassa olevan DataFrame:n nimi, johon lisäämme uusia sarakkeita;name_of_new_column
on nimi, jonka annat uudelle sarakkeelle, jonka lisäät;value_1, value_2, value_3
ovat arvot, jotka täyttävät uuden sarakkeen.
Huomautus
Uuden sarakkeen nimi tulee olla lainausmerkeissä ja hakasulkeissa, kuten
['NewColumnName']
. Uudelle sarakkeelle annetut arvot tulee myös olla hakasulkeissa, esimerkiksidata['NewColumnName'] = [value1, value2, value3]
. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten[1, 2, 3]
. Jos arvot ovat merkkijonoja, jokainen tulee olla lainausmerkeissä, kuten['A', 'B', 'C']
.
Nyt lisäämme 'population'
-sarakkeen olemassa olevaan countries
DataFrameen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Voit myös käyttää piste-notaatiota (esim. df.column
) olemassa olevien sarakkeiden käyttämiseen, mutta sitä ei voida käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkeita (esim. df['column']
) tähän tarkoitukseen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Kuten odotettiin, 'population'
-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä lähestymistavalla.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme