CSV-Dateien
Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann folgende Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z. B.
42,3.14); - Text: Zeichenketten oder kategoriale Daten (z. B.
John,Active); - Datum/Uhrzeit: Zeitstempel (z. B.
2023-12-30); - Booleans: Logische Werte (
True,False).
Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.
Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.
Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);sep: Trennzeichen (Standard ist ein Komma,);header: Zeilennummer, die als Spaltenüberschrift verwendet wird (Standard ist die erste Zeile);names: Liste der zu verwendenden Spaltennamen;usecols: Zu lesende Spalten (Teilmenge der Spalten).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Stellen Sie sicher, dass der Link zum Datensatz in Anführungszeichen steht.
Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma,);columns: Teilmenge der zu schreibenden Spalten (Standard ist alle Spalten);header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard istTrue);index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ihnen wird eine URL zu einer CSV-Datei gegeben, die als Zeichenkette in der Variablen file_url gespeichert ist.
- Lesen Sie die CSV-Datei von der angegebenen URL in ein
DataFramemit dem Namenwine_dataein.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
What are some common use cases for reading and writing CSV files with pandas?
Can you explain the difference between the `header` and `names` parameters in `read_csv()`?
How do I select only specific columns when reading a CSV file with pandas?
Awesome!
Completion rate improved to 3.03
CSV-Dateien
Swipe um das Menü anzuzeigen
Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann folgende Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z. B.
42,3.14); - Text: Zeichenketten oder kategoriale Daten (z. B.
John,Active); - Datum/Uhrzeit: Zeitstempel (z. B.
2023-12-30); - Booleans: Logische Werte (
True,False).
Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.
Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.
Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);sep: Trennzeichen (Standard ist ein Komma,);header: Zeilennummer, die als Spaltenüberschrift verwendet wird (Standard ist die erste Zeile);names: Liste der zu verwendenden Spaltennamen;usecols: Zu lesende Spalten (Teilmenge der Spalten).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Stellen Sie sicher, dass der Link zum Datensatz in Anführungszeichen steht.
Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma,);columns: Teilmenge der zu schreibenden Spalten (Standard ist alle Spalten);header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard istTrue);index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ihnen wird eine URL zu einer CSV-Datei gegeben, die als Zeichenkette in der Variablen file_url gespeichert ist.
- Lesen Sie die CSV-Datei von der angegebenen URL in ein
DataFramemit dem Namenwine_dataein.
Lösung
Danke für Ihr Feedback!
single