CSV-Dateien
Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, darunter auch CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann folgende Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z. B.
42,3.14); - Text: Zeichenketten oder kategoriale Daten (z. B.
John,Active); - Daten/Uhrzeiten: Zeitstempel (z. B.
2023-12-30); - Booleans: logische Werte (
True,False).
Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.
Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.
Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:
Hier ist die aktualisierte Version mit dem Parameter index_col, der klar erläutert wird:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);sep: Trennzeichen (Standard ist ein Komma,);header: Zeilennummer, die als Spaltenüberschriften verwendet wird (Standard ist die erste Zeile);names: Liste der zu verwendenden Spaltennamen;usecols: Teilmenge der zu lesenden Spalten;index_col: Spalte (oder Liste von Spalten), die als DataFrame-Index verwendet wird.
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Stellen Sie sicher, dass der Link zum Datensatz in Anführungszeichen steht.
Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma,);columns: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard istTrue);index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ihnen wird eine URL zu einer CSV-Datei bereitgestellt, die als Zeichenkette in der Variablen file_url gespeichert ist.
- Lesen Sie die CSV-Datei von der angegebenen URL in ein
DataFramemit dem Namenwine_dataein.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
What does the `index_col` parameter do in `read_csv()`?
Can you explain the difference between `header` and `names` in `read_csv()`?
How can I read only specific columns from a CSV file using pandas?
Awesome!
Completion rate improved to 3.03
CSV-Dateien
Swipe um das Menü anzuzeigen
Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, darunter auch CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann folgende Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z. B.
42,3.14); - Text: Zeichenketten oder kategoriale Daten (z. B.
John,Active); - Daten/Uhrzeiten: Zeitstempel (z. B.
2023-12-30); - Booleans: logische Werte (
True,False).
Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.
Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.
Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:
Hier ist die aktualisierte Version mit dem Parameter index_col, der klar erläutert wird:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);sep: Trennzeichen (Standard ist ein Komma,);header: Zeilennummer, die als Spaltenüberschriften verwendet wird (Standard ist die erste Zeile);names: Liste der zu verwendenden Spaltennamen;usecols: Teilmenge der zu lesenden Spalten;index_col: Spalte (oder Liste von Spalten), die als DataFrame-Index verwendet wird.
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Stellen Sie sicher, dass der Link zum Datensatz in Anführungszeichen steht.
Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma,);columns: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard istTrue);index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ihnen wird eine URL zu einer CSV-Datei bereitgestellt, die als Zeichenkette in der Variablen file_url gespeichert ist.
- Lesen Sie die CSV-Datei von der angegebenen URL in ein
DataFramemit dem Namenwine_dataein.
Lösung
Danke für Ihr Feedback!
single