Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele CSV-Tiedostot | Tiedostojen Lukeminen Pandasilla
Pandas Ensimmäiset Askeleet

bookCSV-Tiedostot

Koska pandas on suosittu kirjasto datan analysointiin ja käsittelyyn, yksi sen keskeisistä ominaisuuksista on kyky lukea ja kirjoittaa erilaisia tiedostotyyppejä, mukaan lukien CSV-tiedostot.

CSV (Comma-Separated Values) -tiedosto on tavallinen tekstitiedosto, jota käytetään taulukkomuotoisen datan tallentamiseen, missä kukin rivi edustaa tietuetta ja sarakkeet erotetaan pilkuilla.

CSV-tiedosto voi sisältää seuraavanlaista dataa:

  • Numerot: kokonais- tai desimaaliluvut (esim. 42, 3.14);
  • Teksti: merkkijonot tai kategorinen data (esim. John, Active);
  • Päivät/Ajat: aikaleimat (esim. 2023-12-30);
  • Totuusarvot: loogiset arvot (True, False).

Jokaisella rivillä on oltava sama määrä sarakkeita, ja ensimmäinen rivi sisältää usein sarakkeiden otsikot.

Funktiot kuten read_csv() ja to_csv() ovat käteviä CSV-datan käsittelyssä.

read_csv()-funktion perussyntaksi ja keskeiset parametrit ovat seuraavat:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: polku CSV-tiedostoon (merkkijono tai URL);
  • sep: erotin (oletuksena pilkku ,);
  • header: rivinumero, jota käytetään sarakkeiden otsikoina (oletuksena ensimmäinen rivi);
  • names: käytettävien sarakenimien lista;
  • usecols: luettavat sarakkeet (sarakkeiden osajoukko).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Huomautus

Varmista, että datasetin linkki on lainausmerkeissä.

Perussyntaksi to_csv() ja keskeiset parametrit ovat seuraavat:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: tiedostopolku tai objekti, johon CSV pitäisi kirjoittaa;
  • sep: erotin arvojen erottamiseen (oletus on pilkku ,);
  • columns: kirjoitettavien sarakkeiden osajoukko (oletus on kaikki sarakkeet);
  • header: sisällytetäänkö sarakenimet otsikkona (oletus on True);
  • index: kirjoitetaanko rivien indeksit tiedostoon (oletus on True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tehtävä

Swipe to start coding

Sinulle annetaan URL-osoite CSV-tiedostoon, joka on tallennettu merkkijonona file_url-muuttujaan.

  • Lue CSV-tiedosto annetusta URL-osoitteesta DataFrame-nimiseen wine_data.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What are some common use cases for reading and writing CSV files with pandas?

Can you explain the difference between the `header` and `names` parameters in `read_csv()`?

How do I select only specific columns when reading a CSV file with pandas?

close

Awesome!

Completion rate improved to 3.03

bookCSV-Tiedostot

Pyyhkäise näyttääksesi valikon

Koska pandas on suosittu kirjasto datan analysointiin ja käsittelyyn, yksi sen keskeisistä ominaisuuksista on kyky lukea ja kirjoittaa erilaisia tiedostotyyppejä, mukaan lukien CSV-tiedostot.

CSV (Comma-Separated Values) -tiedosto on tavallinen tekstitiedosto, jota käytetään taulukkomuotoisen datan tallentamiseen, missä kukin rivi edustaa tietuetta ja sarakkeet erotetaan pilkuilla.

CSV-tiedosto voi sisältää seuraavanlaista dataa:

  • Numerot: kokonais- tai desimaaliluvut (esim. 42, 3.14);
  • Teksti: merkkijonot tai kategorinen data (esim. John, Active);
  • Päivät/Ajat: aikaleimat (esim. 2023-12-30);
  • Totuusarvot: loogiset arvot (True, False).

Jokaisella rivillä on oltava sama määrä sarakkeita, ja ensimmäinen rivi sisältää usein sarakkeiden otsikot.

Funktiot kuten read_csv() ja to_csv() ovat käteviä CSV-datan käsittelyssä.

read_csv()-funktion perussyntaksi ja keskeiset parametrit ovat seuraavat:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: polku CSV-tiedostoon (merkkijono tai URL);
  • sep: erotin (oletuksena pilkku ,);
  • header: rivinumero, jota käytetään sarakkeiden otsikoina (oletuksena ensimmäinen rivi);
  • names: käytettävien sarakenimien lista;
  • usecols: luettavat sarakkeet (sarakkeiden osajoukko).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Huomautus

Varmista, että datasetin linkki on lainausmerkeissä.

Perussyntaksi to_csv() ja keskeiset parametrit ovat seuraavat:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: tiedostopolku tai objekti, johon CSV pitäisi kirjoittaa;
  • sep: erotin arvojen erottamiseen (oletus on pilkku ,);
  • columns: kirjoitettavien sarakkeiden osajoukko (oletus on kaikki sarakkeet);
  • header: sisällytetäänkö sarakenimet otsikkona (oletus on True);
  • index: kirjoitetaanko rivien indeksit tiedostoon (oletus on True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tehtävä

Swipe to start coding

Sinulle annetaan URL-osoite CSV-tiedostoon, joka on tallennettu merkkijonona file_url-muuttujaan.

  • Lue CSV-tiedosto annetusta URL-osoitteesta DataFrame-nimiseen wine_data.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1
single

single

some-alt