Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Boksplott | Flere Statistiske Diagrammer
Ultimat Visualisering med Python

bookBoksplott

Note
Definisjon

Boksplott er en annen svært vanlig graf i statistikk som brukes til å visualisere sentraltendens, spredning og potensielle uteliggere i dataene via kvartiler.

Kvartiler

kvartiler

Kvartiler deler sorterte data i fire like deler:

  • Q1 — midtpunktet mellom minimum og medianen (25 % av dataene under);
  • Q2 — medianen (50 % av dataene under);
  • Q3 — midtpunktet mellom medianen og maksimum (75 % av dataene under).

Elementer i boksplott

box_plot_explained
  • Venstre side av boksen viser Q1, høyre side viser Q3;
  • IQR = Q3 − Q1, vist som bredden på boksen, med medianen markert med en gul linje;
  • Whiskers strekker seg til (Q1 - 1.5 \cdot IQR) og (Q3 + 1.5 \cdot IQR);
  • Punkter utenfor whiskers er uteliggere.

Et boksplott kan genereres ved hjelp av matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boksplott-data

Bruk plt.boxplot(x), der x kan være et 1D array-lignende objekt, et 2D array (én boks per kolonne), eller en sekvens av 1D-arrays.

Valgfrie parametere

tick_labels er nyttig for å navngi boksdiagrammer — spesielt når du plotter flere matriser.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Ved å sende en DataFrame med to numeriske kolonner til boxplot() opprettes to separate boksdiagrammer med etiketter automatisk tildelt.

Note
Les mer

Det finnes også en rekke valgfrie parametere for å tilpasse boksplottet, som du kan utforske i boxplot() dokumentasjonen, men i praksis vil du sjelden bruke dem.

Oppgave

Swipe to start coding

Lag to boksdiagrammer ved å bruke to utvalg fra standard normalfordeling:

  1. Bruk riktig funksjon for å lage boksdiagrammene.
  2. Bruk listen normal_sample_1 og normal_sample_2 (i denne rekkefølgen fra venstre til høyre) som data.
  3. Merk det venstre boksdiagrammet som First sample og det høyre som Second sample ved å bruke list.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 2
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain how to interpret a box plot?

What does the IQR tell us about the data?

How do I identify outliers using a box plot?

close

bookBoksplott

Sveip for å vise menyen

Note
Definisjon

Boksplott er en annen svært vanlig graf i statistikk som brukes til å visualisere sentraltendens, spredning og potensielle uteliggere i dataene via kvartiler.

Kvartiler

kvartiler

Kvartiler deler sorterte data i fire like deler:

  • Q1 — midtpunktet mellom minimum og medianen (25 % av dataene under);
  • Q2 — medianen (50 % av dataene under);
  • Q3 — midtpunktet mellom medianen og maksimum (75 % av dataene under).

Elementer i boksplott

box_plot_explained
  • Venstre side av boksen viser Q1, høyre side viser Q3;
  • IQR = Q3 − Q1, vist som bredden på boksen, med medianen markert med en gul linje;
  • Whiskers strekker seg til (Q1 - 1.5 \cdot IQR) og (Q3 + 1.5 \cdot IQR);
  • Punkter utenfor whiskers er uteliggere.

Et boksplott kan genereres ved hjelp av matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boksplott-data

Bruk plt.boxplot(x), der x kan være et 1D array-lignende objekt, et 2D array (én boks per kolonne), eller en sekvens av 1D-arrays.

Valgfrie parametere

tick_labels er nyttig for å navngi boksdiagrammer — spesielt når du plotter flere matriser.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Ved å sende en DataFrame med to numeriske kolonner til boxplot() opprettes to separate boksdiagrammer med etiketter automatisk tildelt.

Note
Les mer

Det finnes også en rekke valgfrie parametere for å tilpasse boksplottet, som du kan utforske i boxplot() dokumentasjonen, men i praksis vil du sjelden bruke dem.

Oppgave

Swipe to start coding

Lag to boksdiagrammer ved å bruke to utvalg fra standard normalfordeling:

  1. Bruk riktig funksjon for å lage boksdiagrammene.
  2. Bruk listen normal_sample_1 og normal_sample_2 (i denne rekkefølgen fra venstre til høyre) som data.
  3. Merk det venstre boksdiagrammet som First sample og det høyre som Second sample ved å bruke list.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 2
single

single

some-alt