CSV-Bestanden
Aangezien pandas de standaardbibliotheek is voor data-analyse en -manipulatie, is een van de belangrijkste functies het kunnen lezen en schrijven van verschillende bestandstypen, waaronder CSV-bestanden.
Een CSV (Comma-Separated Values)-bestand is een tekstbestand dat wordt gebruikt om tabelgegevens op te slaan, waarbij elke rij een record voorstelt en kolommen gescheiden zijn door komma's.
Een CSV-bestand kan de volgende gegevens bevatten:
- Getallen: gehele of decimale waarden (bijv.
42,3.14); - Tekst: strings of categorische gegevens (bijv.
John,Active); - Datums/Tijden: tijdsaanduidingen (bijv.
2023-12-30); - Booleans: logische waarden (
True,False).
Elke rij moet hetzelfde aantal kolommen bevatten, en de eerste rij bevat vaak kolomkoppen.
Functies zoals read_csv() en to_csv() zijn handig bij het werken met CSV-gegevens.
De basis-syntaxis van read_csv() en de belangrijkste parameters zijn als volgt:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: pad naar het CSV-bestand (string of URL);sep: scheidingsteken (standaard een komma,);header: rijnummer dat als kolomkoppen wordt gebruikt (standaard de eerste rij);names: lijst met te gebruiken kolomnamen;usecols: kolommen die gelezen moeten worden (subset van kolommen).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Zorg ervoor dat de datasetlink tussen aanhalingstekens staat.
De basis-syntaxis van to_csv() en de belangrijkste parameters zijn als volgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: bestandspad of object waarnaar de CSV moet worden geschreven;sep: scheidingsteken voor het scheiden van waarden (standaard is een komma,);columns: subset van kolommen om te schrijven (standaard zijn alle kolommen);header: of kolomnamen als kop moeten worden opgenomen (standaard isTrue);index: of rij-indexen naar het bestand moeten worden geschreven (standaard isTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Je krijgt een URL naar een CSV-bestand dat als string is opgeslagen in de variabele file_url.
- Lees het CSV-bestand van de opgegeven URL in een
DataFramemet de naamwine_data.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
What are some common use cases for reading and writing CSV files with pandas?
Can you explain the difference between the `header` and `names` parameters in `read_csv()`?
How do I select only specific columns when reading a CSV file with pandas?
Awesome!
Completion rate improved to 3.03
CSV-Bestanden
Veeg om het menu te tonen
Aangezien pandas de standaardbibliotheek is voor data-analyse en -manipulatie, is een van de belangrijkste functies het kunnen lezen en schrijven van verschillende bestandstypen, waaronder CSV-bestanden.
Een CSV (Comma-Separated Values)-bestand is een tekstbestand dat wordt gebruikt om tabelgegevens op te slaan, waarbij elke rij een record voorstelt en kolommen gescheiden zijn door komma's.
Een CSV-bestand kan de volgende gegevens bevatten:
- Getallen: gehele of decimale waarden (bijv.
42,3.14); - Tekst: strings of categorische gegevens (bijv.
John,Active); - Datums/Tijden: tijdsaanduidingen (bijv.
2023-12-30); - Booleans: logische waarden (
True,False).
Elke rij moet hetzelfde aantal kolommen bevatten, en de eerste rij bevat vaak kolomkoppen.
Functies zoals read_csv() en to_csv() zijn handig bij het werken met CSV-gegevens.
De basis-syntaxis van read_csv() en de belangrijkste parameters zijn als volgt:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: pad naar het CSV-bestand (string of URL);sep: scheidingsteken (standaard een komma,);header: rijnummer dat als kolomkoppen wordt gebruikt (standaard de eerste rij);names: lijst met te gebruiken kolomnamen;usecols: kolommen die gelezen moeten worden (subset van kolommen).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Zorg ervoor dat de datasetlink tussen aanhalingstekens staat.
De basis-syntaxis van to_csv() en de belangrijkste parameters zijn als volgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: bestandspad of object waarnaar de CSV moet worden geschreven;sep: scheidingsteken voor het scheiden van waarden (standaard is een komma,);columns: subset van kolommen om te schrijven (standaard zijn alle kolommen);header: of kolomnamen als kop moeten worden opgenomen (standaard isTrue);index: of rij-indexen naar het bestand moeten worden geschreven (standaard isTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Je krijgt een URL naar een CSV-bestand dat als string is opgeslagen in de variabele file_url.
- Lees het CSV-bestand van de opgegeven URL in een
DataFramemet de naamwine_data.
Oplossing
Bedankt voor je feedback!
single