CSV-Bestanden
Omdat pandas de standaardbibliotheek is voor data-analyse en -manipulatie, is een van de belangrijkste functies het kunnen lezen en schrijven van verschillende bestandstypen, waaronder CSV-bestanden.
Een CSV (Comma-Separated Values) bestand is een tekstbestand dat wordt gebruikt om tabelgegevens op te slaan, waarbij elke rij een record voorstelt en kolommen worden gescheiden door komma's.
Een CSV-bestand kan de volgende gegevens bevatten:
- Getallen: gehele of decimale waarden (bijv.
42,3.14); - Tekst: tekenreeksen of categorische gegevens (bijv.
John,Active); - Datums/Tijden: tijdsaanduidingen (bijv.
2023-12-30); - Booleans: logische waarden (
True,False).
Elke rij moet hetzelfde aantal kolommen bevatten, en de eerste rij bevat vaak kolomkoppen.
Functies zoals read_csv() en to_csv() zijn handig bij het werken met CSV-gegevens.
De basis-syntaxis van read_csv() en de belangrijkste parameters zijn als volgt:
Hier is de bijgewerkte versie met de index_col parameter toegevoegd en duidelijk uitgelegd:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
filepath_or_buffer: pad naar het CSV-bestand (string of URL);sep: scheidingsteken (standaard is een komma,);header: rijnummer dat wordt gebruikt als kolomkoppen (standaard is de eerste rij);names: lijst met te gebruiken kolomnamen;usecols: subset van kolommen om te lezen;index_col: kolom (of lijst van kolommen) die als index van de DataFrame wordt ingesteld.
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Zorg ervoor dat de datasetlink tussen aanhalingstekens staat.
De basis-syntaxis van to_csv() en de belangrijkste parameters zijn als volgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: bestandspad of object waarnaar het CSV-bestand moet worden geschreven;sep: scheidingsteken voor het scheiden van waarden (standaard is een komma,);columns: subset van kolommen om te schrijven (standaard zijn alle kolommen);header: of kolomnamen als kop moeten worden opgenomen (standaard isTrue);index: of rij-indexen naar het bestand moeten worden geschreven (standaard isTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Je krijgt een URL naar een CSV-bestand dat als string is opgeslagen in de variabele file_url.
- Lees het CSV-bestand van de opgegeven URL in een
DataFramemet de naamwine_data.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
What does the `index_col` parameter do in `read_csv()`?
Can you explain the difference between `header` and `names` in `read_csv()`?
How can I read only specific columns from a CSV file using pandas?
Awesome!
Completion rate improved to 3.03
CSV-Bestanden
Veeg om het menu te tonen
Omdat pandas de standaardbibliotheek is voor data-analyse en -manipulatie, is een van de belangrijkste functies het kunnen lezen en schrijven van verschillende bestandstypen, waaronder CSV-bestanden.
Een CSV (Comma-Separated Values) bestand is een tekstbestand dat wordt gebruikt om tabelgegevens op te slaan, waarbij elke rij een record voorstelt en kolommen worden gescheiden door komma's.
Een CSV-bestand kan de volgende gegevens bevatten:
- Getallen: gehele of decimale waarden (bijv.
42,3.14); - Tekst: tekenreeksen of categorische gegevens (bijv.
John,Active); - Datums/Tijden: tijdsaanduidingen (bijv.
2023-12-30); - Booleans: logische waarden (
True,False).
Elke rij moet hetzelfde aantal kolommen bevatten, en de eerste rij bevat vaak kolomkoppen.
Functies zoals read_csv() en to_csv() zijn handig bij het werken met CSV-gegevens.
De basis-syntaxis van read_csv() en de belangrijkste parameters zijn als volgt:
Hier is de bijgewerkte versie met de index_col parameter toegevoegd en duidelijk uitgelegd:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
filepath_or_buffer: pad naar het CSV-bestand (string of URL);sep: scheidingsteken (standaard is een komma,);header: rijnummer dat wordt gebruikt als kolomkoppen (standaard is de eerste rij);names: lijst met te gebruiken kolomnamen;usecols: subset van kolommen om te lezen;index_col: kolom (of lijst van kolommen) die als index van de DataFrame wordt ingesteld.
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Zorg ervoor dat de datasetlink tussen aanhalingstekens staat.
De basis-syntaxis van to_csv() en de belangrijkste parameters zijn als volgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: bestandspad of object waarnaar het CSV-bestand moet worden geschreven;sep: scheidingsteken voor het scheiden van waarden (standaard is een komma,);columns: subset van kolommen om te schrijven (standaard zijn alle kolommen);header: of kolomnamen als kop moeten worden opgenomen (standaard isTrue);index: of rij-indexen naar het bestand moeten worden geschreven (standaard isTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Je krijgt een URL naar een CSV-bestand dat als string is opgeslagen in de variabele file_url.
- Lees het CSV-bestand van de opgegeven URL in een
DataFramemet de naamwine_data.
Oplossing
Bedankt voor je feedback!
single