Boxdiagram
Boxplot är ett annat mycket vanligt diagram inom statistik som används för att visualisera centralmått, spridning och potentiella avvikare i data genom deras kvartiler.
Kvartiler
Kvartiler delar upp sorterad data i fyra lika stora delar:
- Q1 — mittpunkten mellan minimum och medianen (25 % av data under denna);
- Q2 — medianen (50 % av data under denna);
- Q3 — mittpunkten mellan medianen och maximum (75 % av data under denna).
Boxplot-element
- Vänster sida av rutan visar Q1, höger sida visar Q3;
- IQR = Q3 − Q1, visas som rutans bredd, med medianen markerad av en gul linje;
- Viskar sträcker sig till (Q1 - 1,5 \cdot IQR) och (Q3 + 1,5 \cdot IQR);
- Punkter utanför viskarna är avvikare.
Ett lådagram kan genereras med matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Data för lådagram
Använd plt.boxplot(x), där x kan vara ett 1D array-liknande objekt, en 2D-array (en ruta per kolumn), eller en sekvens av 1D-arrayer.
Valfria parametrar
tick_labels är användbart för att namnge boxdiagram — särskilt vid plottning av flera arrayer.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Om en DataFrame med två numeriska kolumner skickas till boxplot() skapas två separata boxdiagram med etiketter som tilldelas automatiskt.
Det finns också en hel del valfria parametrar för att anpassa boxploten, vilka du kan utforska i boxplot() dokumentationen, men i praktiken använder du dem sällan.
Swipe to start coding
Skapa två lådagram med hjälp av två stickprov från standardnormalfördelningen:
- Använd rätt funktion för att skapa lådagrammen.
- Använd listan
normal_sample_1ochnormal_sample_2(i denna ordning från vänster till höger) som data. - Märk det vänstra lådagrammet som
First sampleoch det högra somSecond samplemed hjälp avlist.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.85
Boxdiagram
Svep för att visa menyn
Boxplot är ett annat mycket vanligt diagram inom statistik som används för att visualisera centralmått, spridning och potentiella avvikare i data genom deras kvartiler.
Kvartiler
Kvartiler delar upp sorterad data i fyra lika stora delar:
- Q1 — mittpunkten mellan minimum och medianen (25 % av data under denna);
- Q2 — medianen (50 % av data under denna);
- Q3 — mittpunkten mellan medianen och maximum (75 % av data under denna).
Boxplot-element
- Vänster sida av rutan visar Q1, höger sida visar Q3;
- IQR = Q3 − Q1, visas som rutans bredd, med medianen markerad av en gul linje;
- Viskar sträcker sig till (Q1 - 1,5 \cdot IQR) och (Q3 + 1,5 \cdot IQR);
- Punkter utanför viskarna är avvikare.
Ett lådagram kan genereras med matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Data för lådagram
Använd plt.boxplot(x), där x kan vara ett 1D array-liknande objekt, en 2D-array (en ruta per kolumn), eller en sekvens av 1D-arrayer.
Valfria parametrar
tick_labels är användbart för att namnge boxdiagram — särskilt vid plottning av flera arrayer.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Om en DataFrame med två numeriska kolumner skickas till boxplot() skapas två separata boxdiagram med etiketter som tilldelas automatiskt.
Det finns också en hel del valfria parametrar för att anpassa boxploten, vilka du kan utforska i boxplot() dokumentationen, men i praktiken använder du dem sällan.
Swipe to start coding
Skapa två lådagram med hjälp av två stickprov från standardnormalfördelningen:
- Använd rätt funktion för att skapa lådagrammen.
- Använd listan
normal_sample_1ochnormal_sample_2(i denna ordning från vänster till höger) som data. - Märk det vänstra lådagrammet som
First sampleoch det högra somSecond samplemed hjälp avlist.
Lösning
Tack för dina kommentarer!
single