Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Beskrivelse af Dataene | Analyserer Dataene
Pandas Første Skridt

bookBeskrivelse af Dataene

pandas tilbyder den praktiske mean()-metode, som beregner gennemsnittet af alle værdier for hver kolonne.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Du kan også bruge den samme metode til at bestemme gennemsnitsværdien for en specifik kolonne:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas stiller også mode()-metoden til rådighed, som identificerer den mest forekommende værdi i hver kolonne.

df = pd.read_csv(file.csv)
mode_values = df.mode()

For at finde typetallet for en bestemt kolonne anvendes samme metode:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Bemærk

Vi bruger [0] efter .mode() for at udtrække den første værdi, hvis der findes flere typetal. Uden dette returnerer metoden en komplet Series.

En anden nyttig metode i pandas er describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Denne metode giver et overblik over forskellige målinger fra datasættet, herunder:

  • Samlet antal poster;
  • Gennemsnitlig værdi;
  • Standardafvigelse;
  • Minimums- og maksimumsværdier;
  • 25., 50. (median) og 75. percentiler.
Opgave

Swipe to start coding

Du har fået en DataFrame ved navn wine_data.

  • Beregn gennemsnittet af kolonnen 'residual sugar' og gem resultatet i variablen residual_sugar_mean.
  • Beregn typetallet for kolonnen 'fixed acidity' og gem resultatet i variablen fixed_acidity_mode.
  • Hent et overblik over forskellige statistikker fra wine_data og gem resultatet i variablen described_data.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 11
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.03

bookBeskrivelse af Dataene

Stryg for at vise menuen

pandas tilbyder den praktiske mean()-metode, som beregner gennemsnittet af alle værdier for hver kolonne.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Du kan også bruge den samme metode til at bestemme gennemsnitsværdien for en specifik kolonne:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas stiller også mode()-metoden til rådighed, som identificerer den mest forekommende værdi i hver kolonne.

df = pd.read_csv(file.csv)
mode_values = df.mode()

For at finde typetallet for en bestemt kolonne anvendes samme metode:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Bemærk

Vi bruger [0] efter .mode() for at udtrække den første værdi, hvis der findes flere typetal. Uden dette returnerer metoden en komplet Series.

En anden nyttig metode i pandas er describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Denne metode giver et overblik over forskellige målinger fra datasættet, herunder:

  • Samlet antal poster;
  • Gennemsnitlig værdi;
  • Standardafvigelse;
  • Minimums- og maksimumsværdier;
  • 25., 50. (median) og 75. percentiler.
Opgave

Swipe to start coding

Du har fået en DataFrame ved navn wine_data.

  • Beregn gennemsnittet af kolonnen 'residual sugar' og gem resultatet i variablen residual_sugar_mean.
  • Beregn typetallet for kolonnen 'fixed acidity' og gem resultatet i variablen fixed_acidity_mode.
  • Hent et overblik over forskellige statistikker fra wine_data og gem resultatet i variablen described_data.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

close

Awesome!

Completion rate improved to 3.03
Sektion 3. Kapitel 11
single

single

some-alt