Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære CSV-Filer | Indlæsning af Filer i Pandas
Pandas Første Skridt

bookCSV-Filer

Da pandas er det foretrukne bibliotek til dataanalyse og -manipulation, er en af dets vigtigste funktioner evnen til at læse og skrive forskellige filtyper, herunder CSV-filer.

En CSV (Comma-Separated Values)-fil er en tekstfil, der bruges til at gemme tabeldata, hvor hver række repræsenterer en post, og kolonner adskilles med kommaer.

En CSV-fil kan indeholde følgende data:

  • Tal: heltals- eller decimaltal (f.eks. 42, 3.14);
  • Tekst: strenge eller kategoriske data (f.eks. John, Active);
  • Datoer/tidspunkter: tidsstempler (f.eks. 2023-12-30);
  • Booleske værdier: logiske værdier (True, False).

Hver række skal have samme antal kolonner, og den første række indeholder ofte kolonneoverskrifter.

Funktioner som read_csv() og to_csv() er nyttige til at arbejde med CSV-data.

Den grundlæggende syntaks for read_csv() og centrale parametre er som følger:

Her er den opdaterede version med parameteren index_col tilføjet og tydeligt forklaret:


pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
  • filepath_or_buffer: sti til CSV-filen (streng eller URL);
  • sep: skilletegn (standard er komma ,);
  • header: rækkenummer, der bruges som kolonneoverskrifter (standard er første række);
  • names: liste over kolonnenavne, der skal bruges;
  • usecols: delmængde af kolonner, der skal læses;
  • index_col: kolonne (eller liste af kolonner), der skal bruges som DataFrame-indeks.
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Bemærk

Sørg for, at datasættets link er omsluttet af anførselstegn.

Den grundlæggende syntaks for to_csv() og nøgleparametre er som følger:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: filsti eller objekt, hvor CSV-filen skal skrives;
  • sep: skilletegn til at adskille værdier (standard er komma ,);
  • columns: delmængde af kolonner, der skal skrives (standard er alle kolonner);
  • header: om kolonnenavne skal inkluderes som header (standard er True);
  • index: om rækkeindekser skal skrives til filen (standard er True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Opgave

Swipe to start coding

Du får en URL til en CSV-fil, som er gemt som en streng i variablen file_url.

  • Indlæs CSV-filen fra den angivne URL i en DataFrame med navnet wine_data.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.03

bookCSV-Filer

Stryg for at vise menuen

Da pandas er det foretrukne bibliotek til dataanalyse og -manipulation, er en af dets vigtigste funktioner evnen til at læse og skrive forskellige filtyper, herunder CSV-filer.

En CSV (Comma-Separated Values)-fil er en tekstfil, der bruges til at gemme tabeldata, hvor hver række repræsenterer en post, og kolonner adskilles med kommaer.

En CSV-fil kan indeholde følgende data:

  • Tal: heltals- eller decimaltal (f.eks. 42, 3.14);
  • Tekst: strenge eller kategoriske data (f.eks. John, Active);
  • Datoer/tidspunkter: tidsstempler (f.eks. 2023-12-30);
  • Booleske værdier: logiske værdier (True, False).

Hver række skal have samme antal kolonner, og den første række indeholder ofte kolonneoverskrifter.

Funktioner som read_csv() og to_csv() er nyttige til at arbejde med CSV-data.

Den grundlæggende syntaks for read_csv() og centrale parametre er som følger:

Her er den opdaterede version med parameteren index_col tilføjet og tydeligt forklaret:


pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
  • filepath_or_buffer: sti til CSV-filen (streng eller URL);
  • sep: skilletegn (standard er komma ,);
  • header: rækkenummer, der bruges som kolonneoverskrifter (standard er første række);
  • names: liste over kolonnenavne, der skal bruges;
  • usecols: delmængde af kolonner, der skal læses;
  • index_col: kolonne (eller liste af kolonner), der skal bruges som DataFrame-indeks.
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Bemærk

Sørg for, at datasættets link er omsluttet af anførselstegn.

Den grundlæggende syntaks for to_csv() og nøgleparametre er som følger:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: filsti eller objekt, hvor CSV-filen skal skrives;
  • sep: skilletegn til at adskille værdier (standard er komma ,);
  • columns: delmængde af kolonner, der skal skrives (standard er alle kolonner);
  • header: om kolonnenavne skal inkluderes som header (standard er True);
  • index: om rækkeindekser skal skrives til filen (standard er True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Opgave

Swipe to start coding

Du får en URL til en CSV-fil, som er gemt som en streng i variablen file_url.

  • Indlæs CSV-filen fra den angivne URL i en DataFrame med navnet wine_data.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1
single

single

some-alt