CSV-Filer
Eftersom pandas är det främsta biblioteket för dataanalys och datamanipulation, är en av dess viktigaste funktioner möjligheten att läsa och skriva olika filtyper, inklusive CSV-filer.
En CSV (Comma-Separated Values)-fil är en textfil som används för att lagra tabulär data, där varje rad representerar en post och kolumner separeras med kommatecken.
En CSV-fil kan innehålla följande data:
- Tal: heltals- eller decimaltal (t.ex.
42,3.14); - Text: strängar eller kategoriska data (t.ex.
John,Active); - Datum/Tid: tidsstämplar (t.ex.
2023-12-30); - Booleska värden: logiska värden (
True,False).
Varje rad måste ha samma antal kolumner, och den första raden innehåller ofta kolumnrubriker.
Funktioner som read_csv() och to_csv() är användbara för att hantera CSV-data.
Den grundläggande syntaxen för read_csv() och viktiga parametrar är följande:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: sökväg till CSV-filen (sträng eller URL);sep: avgränsare (standard är kommatecken,);header: radnummer som ska användas som kolumnrubriker (standard är första raden);names: lista med kolumnnamn att använda;usecols: kolumner att läsa (delmängd av kolumner).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Säkerställ att datasetlänken är omsluten av citattecken.
Den grundläggande syntaxen för to_csv() och viktiga parametrar är följande:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: filsökväg eller objekt där CSV-filen ska sparas;sep: avgränsare för att separera värden (standard är komma,);columns: delmängd av kolumner att skriva (standard är alla kolumner);header: om kolumnnamn ska inkluderas som rubrikrad (standard ärTrue);index: om radindex ska skrivas till filen (standard ärTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Du får en URL till en CSV-fil som är lagrad som en sträng i variabeln file_url.
- Läs in CSV-filen från den angivna URL:en till en
DataFramemed namnetwine_data.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.03
CSV-Filer
Svep för att visa menyn
Eftersom pandas är det främsta biblioteket för dataanalys och datamanipulation, är en av dess viktigaste funktioner möjligheten att läsa och skriva olika filtyper, inklusive CSV-filer.
En CSV (Comma-Separated Values)-fil är en textfil som används för att lagra tabulär data, där varje rad representerar en post och kolumner separeras med kommatecken.
En CSV-fil kan innehålla följande data:
- Tal: heltals- eller decimaltal (t.ex.
42,3.14); - Text: strängar eller kategoriska data (t.ex.
John,Active); - Datum/Tid: tidsstämplar (t.ex.
2023-12-30); - Booleska värden: logiska värden (
True,False).
Varje rad måste ha samma antal kolumner, och den första raden innehåller ofta kolumnrubriker.
Funktioner som read_csv() och to_csv() är användbara för att hantera CSV-data.
Den grundläggande syntaxen för read_csv() och viktiga parametrar är följande:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: sökväg till CSV-filen (sträng eller URL);sep: avgränsare (standard är kommatecken,);header: radnummer som ska användas som kolumnrubriker (standard är första raden);names: lista med kolumnnamn att använda;usecols: kolumner att läsa (delmängd av kolumner).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Säkerställ att datasetlänken är omsluten av citattecken.
Den grundläggande syntaxen för to_csv() och viktiga parametrar är följande:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: filsökväg eller objekt där CSV-filen ska sparas;sep: avgränsare för att separera värden (standard är komma,);columns: delmängd av kolumner att skriva (standard är alla kolumner);header: om kolumnnamn ska inkluderas som rubrikrad (standard ärTrue);index: om radindex ska skrivas till filen (standard ärTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Du får en URL till en CSV-fil som är lagrad som en sträng i variabeln file_url.
- Läs in CSV-filen från den angivna URL:en till en
DataFramemed namnetwine_data.
Lösning
Tack för dina kommentarer!
single