Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Boksplot | Flere Statistiske Diagrammer
Quizzes & Challenges
Quizzes
Challenges
/
Ultimativ Visualisering med Python

bookBoksplot

Note
Definition

Box plot er en anden yderst almindelig graf i statistik, der bruges til at visualisere den centrale tendens, spredning og potentielle outliers i dataene via deres kvartiler.

Kvartiler

kvartiler

Kvartiler opdeler sorteret data i fire lige store dele:

  • Q1 — midtpunktet mellem minimum og medianen (25% af data under denne værdi);
  • Q2 — medianen (50% af data under denne værdi);
  • Q3 — midtpunktet mellem medianen og maksimum (75% af data under denne værdi).

Elementer i boksplot

box_plot_explained
  • Venstre side af boksen viser Q1, højre side viser Q3;
  • IQR = Q3 − Q1, vist som boksens bredde, med medianen markeret med en gul linje;
  • Whiskers strækker sig til (Q1 - 1.5 \cdot IQR) og (Q3 + 1.5 \cdot IQR);
  • Punkter uden for whiskers er outliers.

Et box plot kan genereres ved hjælp af matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Box Plot Data

Brug plt.boxplot(x), hvor x kan være et 1D array-lignende objekt, et 2D array (én boks pr. kolonne) eller en sekvens af 1D arrays.

Valgfrie parametre

tick_labels er nyttig til at navngive box plots — især når der plottes flere arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Hvis der gives en DataFrame med to numeriske kolonner til boxplot(), oprettes der to separate box plots med automatisk tildelte etiketter.

Note
Læs Mere

Der findes også en del valgfrie parametre til at tilpasse boxplot, som du kan udforske i boxplot() dokumentationen, men i praksis vil du sjældent anvende dem.

Opgave

Swipe to start coding

Opret to boksplot ved hjælp af to stikprøver fra standard normalfordelingen:

  1. Brug den korrekte funktion til at oprette boksplottene.
  2. Brug listen normal_sample_1 og normal_sample_2 (i denne rækkefølge fra venstre mod højre) som data.
  3. Mærk det venstre boksplot som First sample og det højre som Second sample ved hjælp af list.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain how to interpret a box plot?

What does the IQR tell us about the data?

How do I identify outliers using a box plot?

close

bookBoksplot

Stryg for at vise menuen

Note
Definition

Box plot er en anden yderst almindelig graf i statistik, der bruges til at visualisere den centrale tendens, spredning og potentielle outliers i dataene via deres kvartiler.

Kvartiler

kvartiler

Kvartiler opdeler sorteret data i fire lige store dele:

  • Q1 — midtpunktet mellem minimum og medianen (25% af data under denne værdi);
  • Q2 — medianen (50% af data under denne værdi);
  • Q3 — midtpunktet mellem medianen og maksimum (75% af data under denne værdi).

Elementer i boksplot

box_plot_explained
  • Venstre side af boksen viser Q1, højre side viser Q3;
  • IQR = Q3 − Q1, vist som boksens bredde, med medianen markeret med en gul linje;
  • Whiskers strækker sig til (Q1 - 1.5 \cdot IQR) og (Q3 + 1.5 \cdot IQR);
  • Punkter uden for whiskers er outliers.

Et box plot kan genereres ved hjælp af matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Box Plot Data

Brug plt.boxplot(x), hvor x kan være et 1D array-lignende objekt, et 2D array (én boks pr. kolonne) eller en sekvens af 1D arrays.

Valgfrie parametre

tick_labels er nyttig til at navngive box plots — især når der plottes flere arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Hvis der gives en DataFrame med to numeriske kolonner til boxplot(), oprettes der to separate box plots med automatisk tildelte etiketter.

Note
Læs Mere

Der findes også en del valgfrie parametre til at tilpasse boxplot, som du kan udforske i boxplot() dokumentationen, men i praksis vil du sjældent anvende dem.

Opgave

Swipe to start coding

Opret to boksplot ved hjælp af to stikprøver fra standard normalfordelingen:

  1. Brug den korrekte funktion til at oprette boksplottene.
  2. Brug listen normal_sample_1 og normal_sample_2 (i denne rækkefølge fra venstre mod højre) som data.
  3. Mærk det venstre boksplot som First sample og det højre som Second sample ved hjælp af list.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2
single

single

some-alt