Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele CSV-Tiedostot | Tiedostojen Lukeminen Pandasilla
Pandas Ensimmäiset Askeleet

Pyyhkäise näyttääksesi valikon

book
CSV-Tiedostot

Koska pandas on suosittu kirjasto datan analysointiin ja käsittelyyn, yksi sen keskeisistä ominaisuuksista on kyky lukea ja kirjoittaa erilaisia tiedostotyyppejä, mukaan lukien CSV-tiedostot.

CSV (Comma-Separated Values) -tiedosto on tavallinen tekstitiedosto, jota käytetään taulukkomuotoisen datan tallentamiseen, missä kukin rivi edustaa tietuetta ja sarakkeet erotetaan pilkuilla.

CSV-tiedosto voi sisältää seuraavanlaista dataa:

  • Numerot: kokonais- tai desimaaliluvut (esim. 42, 3.14);

  • Teksti: merkkijonot tai kategorinen data (esim. John, Active);

  • Päivät/Ajat: aikaleimat (esim. 2023-12-30);

  • Totuusarvot: loogiset arvot (True, False).

Jokaisella rivillä on oltava sama määrä sarakkeita, ja ensimmäinen rivi sisältää usein sarakkeiden otsikot.

Funktiot kuten read_csv() ja to_csv() ovat käteviä CSV-datan käsittelyssä.

read_csv()-funktion perussyntaksi ja keskeiset parametrit ovat seuraavat:

python
  • filepath_or_buffer: polku CSV-tiedostoon (merkkijono tai URL);

  • sep: erotin (oletuksena pilkku ,);

  • header: rivinumero, jota käytetään sarakkeiden otsikoina (oletuksena ensimmäinen rivi);

  • names: käytettävien sarakenimien lista;

  • usecols: luettavat sarakkeet (sarakkeiden osajoukko).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Huomautus

Varmista, että datasetin linkki on lainausmerkeissä.

Perussyntaksi to_csv() ja keskeiset parametrit ovat seuraavat:

python
  • path_or_buf: tiedostopolku tai objekti, johon CSV pitäisi kirjoittaa;

  • sep: erotin arvojen erottamiseen (oletus on pilkku ,);

  • columns: kirjoitettavien sarakkeiden osajoukko (oletus on kaikki sarakkeet);

  • header: sisällytetäänkö sarakenimet otsikkona (oletus on True);

  • index: kirjoitetaanko rivien indeksit tiedostoon (oletus on True).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tehtävä

Swipe to start coding

Sinulle annetaan URL-osoite CSV-tiedostoon, joka on tallennettu merkkijonona file_url-muuttujaan.

  • Lue CSV-tiedosto annetusta URL-osoitteesta DataFrame-nimiseen wine_data.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.03

book
CSV-Tiedostot

Koska pandas on suosittu kirjasto datan analysointiin ja käsittelyyn, yksi sen keskeisistä ominaisuuksista on kyky lukea ja kirjoittaa erilaisia tiedostotyyppejä, mukaan lukien CSV-tiedostot.

CSV (Comma-Separated Values) -tiedosto on tavallinen tekstitiedosto, jota käytetään taulukkomuotoisen datan tallentamiseen, missä kukin rivi edustaa tietuetta ja sarakkeet erotetaan pilkuilla.

CSV-tiedosto voi sisältää seuraavanlaista dataa:

  • Numerot: kokonais- tai desimaaliluvut (esim. 42, 3.14);

  • Teksti: merkkijonot tai kategorinen data (esim. John, Active);

  • Päivät/Ajat: aikaleimat (esim. 2023-12-30);

  • Totuusarvot: loogiset arvot (True, False).

Jokaisella rivillä on oltava sama määrä sarakkeita, ja ensimmäinen rivi sisältää usein sarakkeiden otsikot.

Funktiot kuten read_csv() ja to_csv() ovat käteviä CSV-datan käsittelyssä.

read_csv()-funktion perussyntaksi ja keskeiset parametrit ovat seuraavat:

python
  • filepath_or_buffer: polku CSV-tiedostoon (merkkijono tai URL);

  • sep: erotin (oletuksena pilkku ,);

  • header: rivinumero, jota käytetään sarakkeiden otsikoina (oletuksena ensimmäinen rivi);

  • names: käytettävien sarakenimien lista;

  • usecols: luettavat sarakkeet (sarakkeiden osajoukko).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Huomautus

Varmista, että datasetin linkki on lainausmerkeissä.

Perussyntaksi to_csv() ja keskeiset parametrit ovat seuraavat:

python
  • path_or_buf: tiedostopolku tai objekti, johon CSV pitäisi kirjoittaa;

  • sep: erotin arvojen erottamiseen (oletus on pilkku ,);

  • columns: kirjoitettavien sarakkeiden osajoukko (oletus on kaikki sarakkeet);

  • header: sisällytetäänkö sarakenimet otsikkona (oletus on True);

  • index: kirjoitetaanko rivien indeksit tiedostoon (oletus on True).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tehtävä

Swipe to start coding

Sinulle annetaan URL-osoite CSV-tiedostoon, joka on tallennettu merkkijonona file_url-muuttujaan.

  • Lue CSV-tiedosto annetusta URL-osoitteesta DataFrame-nimiseen wine_data.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

close

Awesome!

Completion rate improved to 3.03

Pyyhkäise näyttääksesi valikon

some-alt