Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Uuden Sarakkeen Lisääminen | Ensimmäiset Askeleet
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Johdanto Pandas-kirjastoon

bookUuden Sarakkeen Lisääminen

Olet oppinut, kuinka luodaan DataFrame. Seuraavaksi tutustu, mitä sillä voi tehdä. Luo ensin tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Voit laajentaa DataFrame:a lisäämällä uusia sarakkeita seuraavalla syntaksilla:

dataframe['name_of_new_column'] = [value_1, value_2, value_3]
  • dataframe on olemassa oleva DataFrame, johon lisätään sarake;
  • name_of_new_column on uuden sarakkeen nimi;
  • value_1, value_2, value_3 ovat uuden sarakkeen arvot.
Note
Huomio

Uuden sarakkeen nimi tulee kirjoittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös sijoittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen arvo tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].

Lisää seuraavaksi 'population'-sarakkeen olemassa olevaan countries DataFrameen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Voit käyttää piste-notaatiota (esim. df.column) olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä tähän tarkoitukseen aina hakasulkuja (esim. df['column']).

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Kuten odotettua, 'population'-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookUuden Sarakkeen Lisääminen

Pyyhkäise näyttääksesi valikon

Olet oppinut, kuinka luodaan DataFrame. Seuraavaksi tutustu, mitä sillä voi tehdä. Luo ensin tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Voit laajentaa DataFrame:a lisäämällä uusia sarakkeita seuraavalla syntaksilla:

dataframe['name_of_new_column'] = [value_1, value_2, value_3]
  • dataframe on olemassa oleva DataFrame, johon lisätään sarake;
  • name_of_new_column on uuden sarakkeen nimi;
  • value_1, value_2, value_3 ovat uuden sarakkeen arvot.
Note
Huomio

Uuden sarakkeen nimi tulee kirjoittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös sijoittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen arvo tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].

Lisää seuraavaksi 'population'-sarakkeen olemassa olevaan countries DataFrameen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Voit käyttää piste-notaatiota (esim. df.column) olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä tähän tarkoitukseen aina hakasulkuja (esim. df['column']).

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Kuten odotettua, 'population'-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7
some-alt