Boksplott
Boksplott er en annen svært vanlig graf i statistikk som brukes til å visualisere sentraltendens, spredning og potensielle uteliggere i dataene via kvartiler.
Kvartiler
Kvartiler deler sorterte data i fire like deler:
- Q1 — midtpunktet mellom minimum og medianen (25 % av dataene under);
- Q2 — medianen (50 % av dataene under);
- Q3 — midtpunktet mellom medianen og maksimum (75 % av dataene under).
Elementer i boksplott
- Venstre side av boksen viser Q1, høyre side viser Q3;
- IQR = Q3 − Q1, vist som bredden på boksen, med medianen markert med en gul linje;
- Whiskers strekker seg til (Q1 - 1.5 \cdot IQR) og (Q3 + 1.5 \cdot IQR);
- Punkter utenfor whiskers er uteliggere.
Et boksplott kan genereres ved hjelp av matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Boksplott-data
Bruk plt.boxplot(x), der x kan være et 1D array-lignende objekt, et 2D array (én boks per kolonne), eller en sekvens av 1D-arrays.
Valgfrie parametere
tick_labels er nyttig for å navngi boksdiagrammer — spesielt når du plotter flere matriser.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Ved å sende en DataFrame med to numeriske kolonner til boxplot() opprettes to separate boksdiagrammer med etiketter automatisk tildelt.
Det finnes også en rekke valgfrie parametere for å tilpasse boksplottet, som du kan utforske i boxplot() dokumentasjonen, men i praksis vil du sjelden bruke dem.
Swipe to start coding
Lag to boksdiagrammer ved å bruke to utvalg fra standard normalfordeling:
- Bruk riktig funksjon for å lage boksdiagrammene.
- Bruk listen
normal_sample_1ognormal_sample_2(i denne rekkefølgen fra venstre til høyre) som data. - Merk det venstre boksdiagrammet som
First sampleog det høyre somSecond sampleved å brukelist.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain how to interpret a box plot?
What does the IQR tell us about the data?
How do I identify outliers using a box plot?
Awesome!
Completion rate improved to 3.85
Boksplott
Sveip for å vise menyen
Boksplott er en annen svært vanlig graf i statistikk som brukes til å visualisere sentraltendens, spredning og potensielle uteliggere i dataene via kvartiler.
Kvartiler
Kvartiler deler sorterte data i fire like deler:
- Q1 — midtpunktet mellom minimum og medianen (25 % av dataene under);
- Q2 — medianen (50 % av dataene under);
- Q3 — midtpunktet mellom medianen og maksimum (75 % av dataene under).
Elementer i boksplott
- Venstre side av boksen viser Q1, høyre side viser Q3;
- IQR = Q3 − Q1, vist som bredden på boksen, med medianen markert med en gul linje;
- Whiskers strekker seg til (Q1 - 1.5 \cdot IQR) og (Q3 + 1.5 \cdot IQR);
- Punkter utenfor whiskers er uteliggere.
Et boksplott kan genereres ved hjelp av matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Boksplott-data
Bruk plt.boxplot(x), der x kan være et 1D array-lignende objekt, et 2D array (én boks per kolonne), eller en sekvens av 1D-arrays.
Valgfrie parametere
tick_labels er nyttig for å navngi boksdiagrammer — spesielt når du plotter flere matriser.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Ved å sende en DataFrame med to numeriske kolonner til boxplot() opprettes to separate boksdiagrammer med etiketter automatisk tildelt.
Det finnes også en rekke valgfrie parametere for å tilpasse boksplottet, som du kan utforske i boxplot() dokumentasjonen, men i praksis vil du sjelden bruke dem.
Swipe to start coding
Lag to boksdiagrammer ved å bruke to utvalg fra standard normalfordeling:
- Bruk riktig funksjon for å lage boksdiagrammene.
- Bruk listen
normal_sample_1ognormal_sample_2(i denne rekkefølgen fra venstre til høyre) som data. - Merk det venstre boksdiagrammet som
First sampleog det høyre somSecond sampleved å brukelist.
Løsning
Takk for tilbakemeldingene dine!
single