Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære CSV-Filer | Lese Filer i Pandas
Pandas Første Steg

Sveip for å vise menyen

book
CSV-Filer

Siden pandas er det foretrukne biblioteket for dataanalyse og -manipulering, er en av dets viktigste funksjoner evnen til å lese og skrive ulike filtyper, inkludert CSV-filer.

En CSV (Comma-Separated Values)-fil er en ren tekstfil som brukes til å lagre tabulære data, hvor hver rad representerer en post, og kolonner er atskilt med komma.

En CSV-fil kan inneholde følgende data:

  • Tall: heltall eller desimaltall (f.eks., 42, 3.14);

  • Tekst: strenger eller kategoriske data (f.eks., John, Active);

  • Datoer/Tider: tidsstempler (f.eks., 2023-12-30);

  • Boolske verdier: logiske verdier (True, False).

Hver rad må ha samme antall kolonner, og den første raden inneholder ofte kolonneoverskrifter.

Funksjoner som read_csv() og to_csv() er nyttige for å håndtere CSV-data.

Den grunnleggende syntaksen for read_csv() og nøkkelparametere er som følger:

python
  • filepath_or_buffer: sti til CSV-filen (streng eller URL);

  • sep: skilletegn (standard er et komma ,);

  • header: radnummer som skal brukes som kolonneoverskrifter (standard er den første raden);

  • names: Liste over kolonnenavn som skal brukes;

  • usecols: kolonner som skal leses (delsett av kolonner).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Merk

Sørg for at datasettlenken er omsluttet av anførselstegn.

Den grunnleggende syntaksen for to_csv() og nøkkelparametere er som følger:

python
  • path_or_buf: filbane eller objekt der CSV-en skal skrives;

  • sep: skilletegn for å separere verdier (standard er komma ,);

  • columns: delsett av kolonner som skal skrives (standard er alle kolonner);

  • header: om kolonnenavn skal inkluderes som overskrift (standard er True);

  • index: om radindekser skal skrives til filen (standard er True).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Oppgave

Swipe to start coding

Du har fått en URL til en CSV-fil lagret som en streng i variabelen file_url.

  • Les CSV-filen fra den gitte URL-en inn i en DataFrame kalt wine_data.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 1
Vi beklager at noe gikk galt. Hva skjedde?

Spør AI

expand
ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

book
CSV-Filer

Siden pandas er det foretrukne biblioteket for dataanalyse og -manipulering, er en av dets viktigste funksjoner evnen til å lese og skrive ulike filtyper, inkludert CSV-filer.

En CSV (Comma-Separated Values)-fil er en ren tekstfil som brukes til å lagre tabulære data, hvor hver rad representerer en post, og kolonner er atskilt med komma.

En CSV-fil kan inneholde følgende data:

  • Tall: heltall eller desimaltall (f.eks., 42, 3.14);

  • Tekst: strenger eller kategoriske data (f.eks., John, Active);

  • Datoer/Tider: tidsstempler (f.eks., 2023-12-30);

  • Boolske verdier: logiske verdier (True, False).

Hver rad må ha samme antall kolonner, og den første raden inneholder ofte kolonneoverskrifter.

Funksjoner som read_csv() og to_csv() er nyttige for å håndtere CSV-data.

Den grunnleggende syntaksen for read_csv() og nøkkelparametere er som følger:

python
  • filepath_or_buffer: sti til CSV-filen (streng eller URL);

  • sep: skilletegn (standard er et komma ,);

  • header: radnummer som skal brukes som kolonneoverskrifter (standard er den første raden);

  • names: Liste over kolonnenavn som skal brukes;

  • usecols: kolonner som skal leses (delsett av kolonner).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Merk

Sørg for at datasettlenken er omsluttet av anførselstegn.

Den grunnleggende syntaksen for to_csv() og nøkkelparametere er som følger:

python
  • path_or_buf: filbane eller objekt der CSV-en skal skrives;

  • sep: skilletegn for å separere verdier (standard er komma ,);

  • columns: delsett av kolonner som skal skrives (standard er alle kolonner);

  • header: om kolonnenavn skal inkluderes som overskrift (standard er True);

  • index: om radindekser skal skrives til filen (standard er True).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Oppgave

Swipe to start coding

Du har fått en URL til en CSV-fil lagret som en streng i variabelen file_url.

  • Les CSV-filen fra den gitte URL-en inn i en DataFrame kalt wine_data.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 1
Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Vi beklager at noe gikk galt. Hva skjedde?
some-alt