Uuden Sarakkeen Lisääminen
Olet oppinut luomaan DataFrame-rakenteen. Seuraavaksi tutustu, mitä voit tehdä sillä. Luo ensin tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Voit laajentaa DataFrame-rakennetta lisäämällä uusia sarakkeita seuraavalla syntaksilla:
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
dataframeon olemassa olevaDataFrame, johon lisätään sarake;name_of_new_columnon uuden sarakkeen nimi;value_1, value_2, value_3ovat uuden sarakkeen arvot.
Uuden sarakkeen nimi tulee laittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös laittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen arvo tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].
Lisää seuraavaksi 'population'-sarake olemassa olevaan countries DataFrameen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Piste-notaatiota (esim. df.column) voidaan käyttää olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkuja (esim. df['column']) tähän tarkoitukseen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Kuten odotettua, 'population'-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Why can't I use dot notation to create new columns in a DataFrame?
Can you explain the difference between dot notation and square bracket notation in pandas?
What happens if I try to use dot notation to create a new column?
Awesome!
Completion rate improved to 3.03
Uuden Sarakkeen Lisääminen
Pyyhkäise näyttääksesi valikon
Olet oppinut luomaan DataFrame-rakenteen. Seuraavaksi tutustu, mitä voit tehdä sillä. Luo ensin tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Voit laajentaa DataFrame-rakennetta lisäämällä uusia sarakkeita seuraavalla syntaksilla:
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
dataframeon olemassa olevaDataFrame, johon lisätään sarake;name_of_new_columnon uuden sarakkeen nimi;value_1, value_2, value_3ovat uuden sarakkeen arvot.
Uuden sarakkeen nimi tulee laittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös laittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen arvo tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].
Lisää seuraavaksi 'population'-sarake olemassa olevaan countries DataFrameen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Piste-notaatiota (esim. df.column) voidaan käyttää olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkuja (esim. df['column']) tähän tarkoitukseen.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Kuten odotettua, 'population'-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.
Kiitos palautteestasi!