CSV-Filer
Siden pandas
er det foretrukne biblioteket for dataanalyse og -manipulering, er en av dets viktigste funksjoner evnen til å lese og skrive ulike filtyper, inkludert CSV-filer.
En CSV (Comma-Separated Values)-fil er en ren tekstfil som brukes til å lagre tabulære data, hvor hver rad representerer en post, og kolonner er atskilt med komma.
En CSV-fil kan inneholde følgende data:
Tall: heltall eller desimaltall (f.eks.,
42
,3.14
);Tekst: strenger eller kategoriske data (f.eks.,
John
,Active
);Datoer/Tider: tidsstempler (f.eks.,
2023-12-30
);Boolske verdier: logiske verdier (
True
,False
).
Hver rad må ha samme antall kolonner, og den første raden inneholder ofte kolonneoverskrifter.
Funksjoner som read_csv()
og to_csv()
er nyttige for å håndtere CSV-data.
Den grunnleggende syntaksen for read_csv()
og nøkkelparametere er som følger:
python
filepath_or_buffer
: sti til CSV-filen (streng eller URL);sep
: skilletegn (standard er et komma,
);header
: radnummer som skal brukes som kolonneoverskrifter (standard er den første raden);names
: Liste over kolonnenavn som skal brukes;usecols
: kolonner som skal leses (delsett av kolonner).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Merk
Sørg for at datasettlenken er omsluttet av anførselstegn.
Den grunnleggende syntaksen for to_csv()
og nøkkelparametere er som følger:
python
path_or_buf
: filbane eller objekt der CSV-en skal skrives;sep
: skilletegn for å separere verdier (standard er komma,
);columns
: delsett av kolonner som skal skrives (standard er alle kolonner);header
: om kolonnenavn skal inkluderes som overskrift (standard erTrue
);index
: om radindekser skal skrives til filen (standard erTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Du har fått en URL til en CSV-fil lagret som en streng i variabelen file_url
.
- Les CSV-filen fra den gitte URL-en inn i en
DataFrame
kaltwine_data
.
Løsning
Takk for tilbakemeldingene dine!