Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Uuden Sarakkeen Lisääminen | Ensimmäiset Askeleet
Pandas Ensimmäiset Askeleet

bookUuden Sarakkeen Lisääminen

Olet oppinut luomaan DataFrame-rakenteen. Seuraavaksi tutustu, mitä voit tehdä sillä. Luo ensin tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Voit laajentaa DataFrame-rakennetta lisäämällä uusia sarakkeita seuraavalla syntaksilla:

dataframe['name_of_new_column'] = [value_1, value_2, value_3]
  • dataframe on olemassa oleva DataFrame, johon lisätään sarake;
  • name_of_new_column on uuden sarakkeen nimi;
  • value_1, value_2, value_3 ovat uuden sarakkeen arvot.
Note
Huomio

Uuden sarakkeen nimi tulee laittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös laittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen arvo tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].

Lisää seuraavaksi 'population'-sarake olemassa olevaan countries DataFrameen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Piste-notaatiota (esim. df.column) voidaan käyttää olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkuja (esim. df['column']) tähän tarkoitukseen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Kuten odotettua, 'population'-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 3.03

bookUuden Sarakkeen Lisääminen

Pyyhkäise näyttääksesi valikon

Olet oppinut luomaan DataFrame-rakenteen. Seuraavaksi tutustu, mitä voit tehdä sillä. Luo ensin tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Voit laajentaa DataFrame-rakennetta lisäämällä uusia sarakkeita seuraavalla syntaksilla:

dataframe['name_of_new_column'] = [value_1, value_2, value_3]
  • dataframe on olemassa oleva DataFrame, johon lisätään sarake;
  • name_of_new_column on uuden sarakkeen nimi;
  • value_1, value_2, value_3 ovat uuden sarakkeen arvot.
Note
Huomio

Uuden sarakkeen nimi tulee laittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös laittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen arvo tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].

Lisää seuraavaksi 'population'-sarake olemassa olevaan countries DataFrameen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Piste-notaatiota (esim. df.column) voidaan käyttää olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkuja (esim. df['column']) tähän tarkoitukseen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Kuten odotettua, 'population'-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7
some-alt