Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Uuden Sarakkeen Lisääminen | Ensimmäiset Askeleet
Pandas Ensimmäiset Askeleet

book
Uuden Sarakkeen Lisääminen

Olemme oppineet, kuinka luodaan DataFrame. Nyt tutkitaan, mitä voimme tehdä sillä. Ensin luomme kompaktin DataFrame:n, joka koostuu 3 sarakkeesta ja 7 rivistä.

import pandas as pd
countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'],
'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'],
'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}

countries = pd.DataFrame(countries_data)
print(countries)
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Voit laajentaa DataFramea lisäämällä uusia sarakkeita, ja yleisin tapa tehdä se on seuraava:

python
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
  • dataframe on olemassa olevan DataFrame:n nimi, johon lisäämme uusia sarakkeita;

  • name_of_new_column on nimi, jonka annat uudelle sarakkeelle, jonka lisäät;

  • value_1, value_2, value_3 ovat arvot, jotka täyttävät uuden sarakkeen.

Huomautus

Uuden sarakkeen nimi tulee olla lainausmerkeissä ja hakasulkeissa, kuten ['NewColumnName']. Uudelle sarakkeelle annetut arvot tulee myös olla hakasulkeissa, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen tulee olla lainausmerkeissä, kuten ['A', 'B', 'C'].

Nyt lisäämme 'population'-sarakkeen olemassa olevaan countries DataFrameen.

import pandas as pd
countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'],
'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'],
'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(countries_data)

countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200]
print(countries)
12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Voit myös käyttää piste-notaatiota (esim. df.column) olemassa olevien sarakkeiden käyttämiseen, mutta sitä ei voida käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkeita (esim. df['column']) tähän tarkoitukseen.

import pandas as pd
countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'],
'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'],
'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(countries_data)

countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200]
print(countries)
12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Kuten odotettiin, 'population'-saraketta ei luotu, koska Pandas ei salli sarakkeiden luomista tällä lähestymistavalla.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7

Kysy tekoälyä

expand
ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

We use cookies to make your experience better!
some-alt