CSV-Filer
Eftersom pandas
är det främsta biblioteket för dataanalys och datamanipulation, är en av dess nyckelfunktioner dess förmåga att läsa och skriva olika filtyper, inklusive CSV-filer.
En CSV (Comma-Separated Values)-fil är en vanlig textfil som används för att lagra tabulär data, där varje rad representerar en post och kolumner separeras med kommatecken.
En CSV-fil kan innehålla följande data:
- Tal: heltal eller decimaltal (t.ex.
42
,3.14
); - Text: strängar eller kategoriska data (t.ex.
John
,Active
); - Datum/Tider: tidsstämplar (t.ex.
2023-12-30
); - Booleska värden: logiska värden (
True
,False
).
Varje rad måste ha samma antal kolumner, och den första raden innehåller ofta kolumnrubriker.
Funktioner som read_csv()
och to_csv()
är praktiska för att hantera CSV-data.
Den grundläggande syntaxen för read_csv()
och viktiga parametrar är följande:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: sökväg till CSV-filen (sträng eller URL);sep
: avgränsare (standard är ett kommatecken,
);header
: radnummer att använda som kolumnrubriker (standard är första raden);names
: Lista över kolumnnamn att använda;usecols
: kolumner att läsa (delmängd av kolumner).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Notera
Se till att datasetlänken är omsluten av citattecken.
Den grundläggande syntaxen för to_csv()
och viktiga parametrar är följande:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: filväg eller objekt där CSV-filen ska skrivas;sep
: avgränsare för att separera värden (standard är ett kommatecken,
);columns
: delmängd av kolumner att skriva (standard är alla kolumner);header
: om kolumnnamn ska inkluderas som rubrik (standard ärTrue
);index
: om radindex ska skrivas till filen (standard ärTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Du har fått en URL till en CSV-fil lagrad som en sträng i variabeln file_url
.
- Läs CSV-filen från den angivna URL:en till en
DataFrame
med namnetwine_data
.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.03
CSV-Filer
Svep för att visa menyn
Eftersom pandas
är det främsta biblioteket för dataanalys och datamanipulation, är en av dess nyckelfunktioner dess förmåga att läsa och skriva olika filtyper, inklusive CSV-filer.
En CSV (Comma-Separated Values)-fil är en vanlig textfil som används för att lagra tabulär data, där varje rad representerar en post och kolumner separeras med kommatecken.
En CSV-fil kan innehålla följande data:
- Tal: heltal eller decimaltal (t.ex.
42
,3.14
); - Text: strängar eller kategoriska data (t.ex.
John
,Active
); - Datum/Tider: tidsstämplar (t.ex.
2023-12-30
); - Booleska värden: logiska värden (
True
,False
).
Varje rad måste ha samma antal kolumner, och den första raden innehåller ofta kolumnrubriker.
Funktioner som read_csv()
och to_csv()
är praktiska för att hantera CSV-data.
Den grundläggande syntaxen för read_csv()
och viktiga parametrar är följande:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: sökväg till CSV-filen (sträng eller URL);sep
: avgränsare (standard är ett kommatecken,
);header
: radnummer att använda som kolumnrubriker (standard är första raden);names
: Lista över kolumnnamn att använda;usecols
: kolumner att läsa (delmängd av kolumner).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Notera
Se till att datasetlänken är omsluten av citattecken.
Den grundläggande syntaxen för to_csv()
och viktiga parametrar är följande:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: filväg eller objekt där CSV-filen ska skrivas;sep
: avgränsare för att separera värden (standard är ett kommatecken,
);columns
: delmängd av kolumner att skriva (standard är alla kolumner);header
: om kolumnnamn ska inkluderas som rubrik (standard ärTrue
);index
: om radindex ska skrivas till filen (standard ärTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Du har fått en URL till en CSV-fil lagrad som en sträng i variabeln file_url
.
- Läs CSV-filen från den angivna URL:en till en
DataFrame
med namnetwine_data
.
Lösning
Tack för dina kommentarer!
Awesome!
Completion rate improved to 3.03single