Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære CSV-Filer | Læsning af Filer i Pandas
Pandas Første Skridt

bookCSV-Filer

Da pandas er det foretrukne bibliotek til dataanalyse og -manipulation, er en af dets vigtigste funktioner evnen til at læse og skrive forskellige filtyper, herunder CSV-filer.

En CSV (Comma-Separated Values)-fil er en tekstfil, der bruges til at gemme tabeldata, hvor hver række repræsenterer en post, og kolonner adskilles med kommaer.

En CSV-fil kan indeholde følgende data:

  • Tal: heltals- eller decimaltal (f.eks. 42, 3.14);
  • Tekst: strenge eller kategoriske data (f.eks. John, Active);
  • Datoer/Tidspunkter: tidsstempler (f.eks. 2023-12-30);
  • Booleske værdier: logiske værdier (True, False).

Hver række skal have samme antal kolonner, og den første række indeholder ofte kolonneoverskrifter.

Funktioner som read_csv() og to_csv() er nyttige til at arbejde med CSV-data.

Den grundlæggende syntaks for read_csv() og vigtige parametre er som følger:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: sti til CSV-filen (streng eller URL);
  • sep: skilletegn (standard er komma ,);
  • header: rækkenummer der bruges som kolonneoverskrifter (standard er første række);
  • names: Liste over kolonnenavne der skal bruges;
  • usecols: Kolonner der skal læses (et delmængde af kolonnerne).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Bemærk

Sørg for, at datasættets link er omsluttet af anførselstegn.

Den grundlæggende syntaks for to_csv() og nøgleparametre er som følger:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: filsti eller objekt, hvor CSV-filen skal skrives;
  • sep: skilletegn til at adskille værdier (standard er komma ,);
  • columns: delmængde af kolonner, der skal skrives (standard er alle kolonner);
  • header: om kolonnenavne skal inkluderes som header (standard er True);
  • index: om rækkeindekser skal skrives til filen (standard er True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Opgave

Swipe to start coding

Du får en URL til en CSV-fil, som er gemt som en streng i variablen file_url.

  • Indlæs CSV-filen fra den angivne URL i en DataFrame med navnet wine_data.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

What are some common use cases for reading and writing CSV files with pandas?

Can you explain the difference between the `header` and `names` parameters in `read_csv()`?

How do I select only specific columns when reading a CSV file with pandas?

close

Awesome!

Completion rate improved to 3.03

bookCSV-Filer

Stryg for at vise menuen

Da pandas er det foretrukne bibliotek til dataanalyse og -manipulation, er en af dets vigtigste funktioner evnen til at læse og skrive forskellige filtyper, herunder CSV-filer.

En CSV (Comma-Separated Values)-fil er en tekstfil, der bruges til at gemme tabeldata, hvor hver række repræsenterer en post, og kolonner adskilles med kommaer.

En CSV-fil kan indeholde følgende data:

  • Tal: heltals- eller decimaltal (f.eks. 42, 3.14);
  • Tekst: strenge eller kategoriske data (f.eks. John, Active);
  • Datoer/Tidspunkter: tidsstempler (f.eks. 2023-12-30);
  • Booleske værdier: logiske værdier (True, False).

Hver række skal have samme antal kolonner, og den første række indeholder ofte kolonneoverskrifter.

Funktioner som read_csv() og to_csv() er nyttige til at arbejde med CSV-data.

Den grundlæggende syntaks for read_csv() og vigtige parametre er som følger:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: sti til CSV-filen (streng eller URL);
  • sep: skilletegn (standard er komma ,);
  • header: rækkenummer der bruges som kolonneoverskrifter (standard er første række);
  • names: Liste over kolonnenavne der skal bruges;
  • usecols: Kolonner der skal læses (et delmængde af kolonnerne).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Bemærk

Sørg for, at datasættets link er omsluttet af anførselstegn.

Den grundlæggende syntaks for to_csv() og nøgleparametre er som følger:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: filsti eller objekt, hvor CSV-filen skal skrives;
  • sep: skilletegn til at adskille værdier (standard er komma ,);
  • columns: delmængde af kolonner, der skal skrives (standard er alle kolonner);
  • header: om kolonnenavne skal inkluderes som header (standard er True);
  • index: om rækkeindekser skal skrives til filen (standard er True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Opgave

Swipe to start coding

Du får en URL til en CSV-fil, som er gemt som en streng i variablen file_url.

  • Indlæs CSV-filen fra den angivne URL i en DataFrame med navnet wine_data.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1
single

single

some-alt