CSV-Filer
Eftersom pandas
är det främsta biblioteket för dataanalys och datamanipulation, är en av dess nyckelfunktioner dess förmåga att läsa och skriva olika filtyper, inklusive CSV-filer.
En CSV (Comma-Separated Values)-fil är en vanlig textfil som används för att lagra tabulär data, där varje rad representerar en post och kolumner separeras med kommatecken.
En CSV-fil kan innehålla följande data:
Tal: heltal eller decimaltal (t.ex.
42
,3.14
);Text: strängar eller kategoriska data (t.ex.
John
,Active
);Datum/Tider: tidsstämplar (t.ex.
2023-12-30
);Booleska värden: logiska värden (
True
,False
).
Varje rad måste ha samma antal kolumner, och den första raden innehåller ofta kolumnrubriker.
Funktioner som read_csv()
och to_csv()
är praktiska för att hantera CSV-data.
Den grundläggande syntaxen för read_csv()
och viktiga parametrar är följande:
python
filepath_or_buffer
: sökväg till CSV-filen (sträng eller URL);sep
: avgränsare (standard är ett kommatecken,
);header
: radnummer att använda som kolumnrubriker (standard är första raden);names
: Lista över kolumnnamn att använda;usecols
: kolumner att läsa (delmängd av kolumner).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Notera
Se till att datasetlänken är omsluten av citattecken.
Den grundläggande syntaxen för to_csv()
och viktiga parametrar är följande:
python
path_or_buf
: filväg eller objekt där CSV-filen ska skrivas;sep
: avgränsare för att separera värden (standard är ett kommatecken,
);columns
: delmängd av kolumner att skriva (standard är alla kolumner);header
: om kolumnnamn ska inkluderas som rubrik (standard ärTrue
);index
: om radindex ska skrivas till filen (standard ärTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Du har fått en URL till en CSV-fil lagrad som en sträng i variabeln file_url
.
- Läs CSV-filen från den angivna URL:en till en
DataFrame
med namnetwine_data
.
Lösning
Tack för dina kommentarer!