CSV-Tiedostot
pandas-kirjasto on keskeinen työkalu datan analysointiin ja käsittelyyn, ja yksi sen tärkeimmistä ominaisuuksista on kyky lukea ja kirjoittaa erilaisia tiedostomuotoja, kuten CSV-tiedostoja.
CSV (Comma-Separated Values) -tiedosto on pelkkä tekstitiedosto, jota käytetään taulukkomuotoisen datan tallentamiseen. Jokainen rivi edustaa tietuetta, ja sarakkeet erotetaan pilkuilla.
CSV-tiedosto voi sisältää seuraavanlaista dataa:
- Numerot: kokonais- tai desimaaliluvut (esim.
42,3.14); - Teksti: merkkijonot tai kategorinen data (esim.
John,Active); - Päivämäärät/Ajat: aikaleimat (esim.
2023-12-30); - Totuusarvot: loogiset arvot (
True,False).
Jokaisella rivillä tulee olla sama määrä sarakkeita, ja ensimmäinen rivi sisältää usein sarakkeiden otsikot.
Funktiot kuten read_csv() ja to_csv() ovat hyödyllisiä CSV-datan käsittelyssä.
read_csv()-funktion perussyntaksi ja keskeiset parametrit ovat seuraavat:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: CSV-tiedoston polku (merkkijono tai URL);sep: erotinmerkki (oletuksena pilkku,);header: rivinumero, jota käytetään sarakeotsikoina (oletuksena ensimmäinen rivi);names: käytettävien sarakeotsikoiden lista;usecols: luettavat sarakkeet (sarakkeiden osajoukko).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Varmista, että tietoaineiston linkki on lainausmerkeissä.
Perussyntaksi to_csv()-funktiolle ja keskeiset parametrit ovat seuraavat:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: tiedostopolku tai objekti, johon CSV kirjoitetaan;sep: arvojen erotinmerkki (oletuksena pilkku,);columns: sarakkeiden osajoukko, jotka kirjoitetaan (oletuksena kaikki sarakkeet);header: sisällytetäänkö sarakeotsikot tiedoston alkuun (oletuksenaTrue);index: kirjoitetaanko rivin indeksit tiedostoon (oletuksenaTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Sinulle on annettu CSV-tiedoston URL-osoite merkkijonona muuttujassa file_url.
- Lue CSV-tiedosto annetusta URL-osoitteesta
DataFrame-muuttujaan nimeltäwine_data.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
What are some common use cases for reading and writing CSV files with pandas?
Can you explain the difference between the `header` and `names` parameters in `read_csv()`?
How do I select only specific columns when reading a CSV file with pandas?
Awesome!
Completion rate improved to 3.03
CSV-Tiedostot
Pyyhkäise näyttääksesi valikon
pandas-kirjasto on keskeinen työkalu datan analysointiin ja käsittelyyn, ja yksi sen tärkeimmistä ominaisuuksista on kyky lukea ja kirjoittaa erilaisia tiedostomuotoja, kuten CSV-tiedostoja.
CSV (Comma-Separated Values) -tiedosto on pelkkä tekstitiedosto, jota käytetään taulukkomuotoisen datan tallentamiseen. Jokainen rivi edustaa tietuetta, ja sarakkeet erotetaan pilkuilla.
CSV-tiedosto voi sisältää seuraavanlaista dataa:
- Numerot: kokonais- tai desimaaliluvut (esim.
42,3.14); - Teksti: merkkijonot tai kategorinen data (esim.
John,Active); - Päivämäärät/Ajat: aikaleimat (esim.
2023-12-30); - Totuusarvot: loogiset arvot (
True,False).
Jokaisella rivillä tulee olla sama määrä sarakkeita, ja ensimmäinen rivi sisältää usein sarakkeiden otsikot.
Funktiot kuten read_csv() ja to_csv() ovat hyödyllisiä CSV-datan käsittelyssä.
read_csv()-funktion perussyntaksi ja keskeiset parametrit ovat seuraavat:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: CSV-tiedoston polku (merkkijono tai URL);sep: erotinmerkki (oletuksena pilkku,);header: rivinumero, jota käytetään sarakeotsikoina (oletuksena ensimmäinen rivi);names: käytettävien sarakeotsikoiden lista;usecols: luettavat sarakkeet (sarakkeiden osajoukko).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Varmista, että tietoaineiston linkki on lainausmerkeissä.
Perussyntaksi to_csv()-funktiolle ja keskeiset parametrit ovat seuraavat:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: tiedostopolku tai objekti, johon CSV kirjoitetaan;sep: arvojen erotinmerkki (oletuksena pilkku,);columns: sarakkeiden osajoukko, jotka kirjoitetaan (oletuksena kaikki sarakkeet);header: sisällytetäänkö sarakeotsikot tiedoston alkuun (oletuksenaTrue);index: kirjoitetaanko rivin indeksit tiedostoon (oletuksenaTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Sinulle on annettu CSV-tiedoston URL-osoite merkkijonona muuttujassa file_url.
- Lue CSV-tiedosto annetusta URL-osoitteesta
DataFrame-muuttujaan nimeltäwine_data.
Ratkaisu
Kiitos palautteestasi!
single