CSV-Dateien
Da pandas
die bevorzugte Bibliothek für Datenanalyse und -manipulation ist, besteht eine ihrer Hauptfunktionen in der Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine einfache Textdatei, die zur Speicherung tabellarischer Daten verwendet wird, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann die folgenden Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z.B.
42
,3.14
); - Text: Zeichenketten oder kategoriale Daten (z.B.
John
,Active
); - Daten/Zeitangaben: Zeitstempel (z.B.
2023-12-30
); - Booleans: logische Werte (
True
,False
).
Jede Zeile muss die gleiche Anzahl von Spalten haben, und die erste Zeile enthält oft Spaltenüberschriften.
Funktionen wie read_csv()
und to_csv()
sind nützlich für den Umgang mit CSV-Daten.
Die grundlegende Syntax von read_csv()
und die wichtigsten Parameter sind wie folgt:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: Pfad zur CSV-Datei (String oder URL);sep
: Trennzeichen (Standard ist ein Komma,
);header
: Zeilennummer, die als Spaltenüberschriften verwendet werden soll (Standard ist die erste Zeile);names
: Liste der zu verwendenden Spaltennamen;usecols
: zu lesende Spalten (Teilmenge der Spalten).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Hinweis
Stellen Sie sicher, dass der Datensatz-Link in Anführungszeichen eingeschlossen ist.
Die grundlegende Syntax von to_csv()
und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: Dateipfad oder Objekt, in das die CSV geschrieben werden soll;sep
: Trennzeichen zum Trennen von Werten (Standard ist ein Komma,
);columns
: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);header
: ob die Spaltennamen als Kopfzeile enthalten sein sollen (Standard istTrue
);index
: ob Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Lesen Sie die CSV-Datei in ein DataFrame ein.
- Zeigen Sie den Inhalt auf Ihrem Bildschirm an.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.03
CSV-Dateien
Swipe um das Menü anzuzeigen
Da pandas
die bevorzugte Bibliothek für Datenanalyse und -manipulation ist, besteht eine ihrer Hauptfunktionen in der Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine einfache Textdatei, die zur Speicherung tabellarischer Daten verwendet wird, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann die folgenden Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z.B.
42
,3.14
); - Text: Zeichenketten oder kategoriale Daten (z.B.
John
,Active
); - Daten/Zeitangaben: Zeitstempel (z.B.
2023-12-30
); - Booleans: logische Werte (
True
,False
).
Jede Zeile muss die gleiche Anzahl von Spalten haben, und die erste Zeile enthält oft Spaltenüberschriften.
Funktionen wie read_csv()
und to_csv()
sind nützlich für den Umgang mit CSV-Daten.
Die grundlegende Syntax von read_csv()
und die wichtigsten Parameter sind wie folgt:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: Pfad zur CSV-Datei (String oder URL);sep
: Trennzeichen (Standard ist ein Komma,
);header
: Zeilennummer, die als Spaltenüberschriften verwendet werden soll (Standard ist die erste Zeile);names
: Liste der zu verwendenden Spaltennamen;usecols
: zu lesende Spalten (Teilmenge der Spalten).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Hinweis
Stellen Sie sicher, dass der Datensatz-Link in Anführungszeichen eingeschlossen ist.
Die grundlegende Syntax von to_csv()
und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: Dateipfad oder Objekt, in das die CSV geschrieben werden soll;sep
: Trennzeichen zum Trennen von Werten (Standard ist ein Komma,
);columns
: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);header
: ob die Spaltennamen als Kopfzeile enthalten sein sollen (Standard istTrue
);index
: ob Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Lesen Sie die CSV-Datei in ein DataFrame ein.
- Zeigen Sie den Inhalt auf Ihrem Bildschirm an.
Lösung
Danke für Ihr Feedback!
Awesome!
Completion rate improved to 3.03single