Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Beskrive Dataene | Analysere Dataene
Pandas Første Steg

bookBeskrive Dataene

pandas tilbyr den praktiske mean()-metoden som beregner gjennomsnittet av alle verdier for hver kolonne.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Du kan også bruke den samme metoden for å finne gjennomsnittsverdien for en bestemt kolonne:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas tilbyr også mode()-metoden, som identifiserer den mest forekommende verdien i hver kolonne.

df = pd.read_csv(file.csv)
mode_values = df.mode()

For å finne typetallet for en bestemt kolonne, brukes samme metode:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Merk

Vi bruker [0] etter .mode() for å hente ut den første verdien dersom det finnes flere typetall. Uten dette returnerer metoden en full Series.

En annen nyttig metode i pandas er describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Denne metoden gir en oversikt over ulike måleverdier fra datasettet, inkludert:

  • Totalt antall oppføringer;
  • Gjennomsnittlig verdi;
  • Standardavvik;
  • Minimums- og maksimumsverdier;
  • 25., 50. (median) og 75. percentil.
Oppgave

Swipe to start coding

Du har fått en DataFrame kalt wine_data.

  • Beregn gjennomsnittet av kolonnen 'residual sugar' og lagre resultatet i variabelen residual_sugar_mean.
  • Beregn typetallet for kolonnen 'fixed acidity' og lagre resultatet i variabelen fixed_acidity_mode.
  • Hent en oversikt over ulike statistikker fra wine_data og lagre resultatet i variabelen described_data.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 11
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 3.03

bookBeskrive Dataene

Sveip for å vise menyen

pandas tilbyr den praktiske mean()-metoden som beregner gjennomsnittet av alle verdier for hver kolonne.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Du kan også bruke den samme metoden for å finne gjennomsnittsverdien for en bestemt kolonne:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas tilbyr også mode()-metoden, som identifiserer den mest forekommende verdien i hver kolonne.

df = pd.read_csv(file.csv)
mode_values = df.mode()

For å finne typetallet for en bestemt kolonne, brukes samme metode:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Merk

Vi bruker [0] etter .mode() for å hente ut den første verdien dersom det finnes flere typetall. Uten dette returnerer metoden en full Series.

En annen nyttig metode i pandas er describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Denne metoden gir en oversikt over ulike måleverdier fra datasettet, inkludert:

  • Totalt antall oppføringer;
  • Gjennomsnittlig verdi;
  • Standardavvik;
  • Minimums- og maksimumsverdier;
  • 25., 50. (median) og 75. percentil.
Oppgave

Swipe to start coding

Du har fått en DataFrame kalt wine_data.

  • Beregn gjennomsnittet av kolonnen 'residual sugar' og lagre resultatet i variabelen residual_sugar_mean.
  • Beregn typetallet for kolonnen 'fixed acidity' og lagre resultatet i variabelen fixed_acidity_mode.
  • Hent en oversikt over ulike statistikker fra wine_data og lagre resultatet i variabelen described_data.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

close

Awesome!

Completion rate improved to 3.03
Seksjon 3. Kapittel 11
single

single

some-alt