Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Analys av data med lådagram | Sektion
Practice
Projects
Quizzes & Challenges
Frågesporter
Challenges
/
Datavisualisering med Matplotlib

bookAnalys av data med lådagram

Note
Definition

Boxplot är ett annat mycket vanligt diagram inom statistik som används för att visualisera central tendens, spridning och potentiella avvikare i data genom deras kvartiler.

Kvartiler

kvartiler

Kvartiler delar upp sorterad data i fyra lika stora delar:

  • Q1 — mittpunkten mellan minimum och medianen (25 % av data under denna);
  • Q2 — medianen (50 % av data under);
  • Q3 — mittpunkten mellan medianen och maximum (75 % av data under).

Boxplot-element

box_plot_explained
  • Vänstra sidan av rutan visar Q1, högra sidan visar Q3;
  • IQR = Q3 − Q1, visas som rutans bredd, med medianen markerad av en gul linje;
  • Viskare sträcker sig till (Q1 - 1.5 \cdot IQR) och (Q3 + 1.5 \cdot IQR);
  • Punkter utanför viskarna är avvikare.

Ett lådagram kan genereras med matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Lådagramdata

Använd plt.boxplot(x), där x kan vara ett 1D array-liknande objekt, en 2D-array (en ruta per kolumn), eller en sekvens av 1D-arrayer.

Valfria parametrar

tick_labels är användbart för att namnge boxdiagram — särskilt vid plottning av flera arrayer.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Om en DataFrame med två numeriska kolumner skickas till boxplot() skapas två separata boxdiagram med etiketter som tilldelas automatiskt.

Note
Läs vidare

Det finns också ett flertal valfria parametrar för att anpassa lådagrammet, vilka du kan utforska i boxplot()-dokumentationen, men i praktiken använder du dem sällan.

Uppgift

Swipe to start coding

Skapa två lådagram med två stickprov från standardnormalfördelningen:

  1. Använd rätt funktion för att skapa lådagrammen.
  2. Använd listorna normal_sample_1 och normal_sample_2 (i denna ordning från vänster till höger) som data.
  3. Märk det vänstra lådagrammet som First sample och det högra som Second sample med hjälp av list.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 16
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

bookAnalys av data med lådagram

Svep för att visa menyn

Note
Definition

Boxplot är ett annat mycket vanligt diagram inom statistik som används för att visualisera central tendens, spridning och potentiella avvikare i data genom deras kvartiler.

Kvartiler

kvartiler

Kvartiler delar upp sorterad data i fyra lika stora delar:

  • Q1 — mittpunkten mellan minimum och medianen (25 % av data under denna);
  • Q2 — medianen (50 % av data under);
  • Q3 — mittpunkten mellan medianen och maximum (75 % av data under).

Boxplot-element

box_plot_explained
  • Vänstra sidan av rutan visar Q1, högra sidan visar Q3;
  • IQR = Q3 − Q1, visas som rutans bredd, med medianen markerad av en gul linje;
  • Viskare sträcker sig till (Q1 - 1.5 \cdot IQR) och (Q3 + 1.5 \cdot IQR);
  • Punkter utanför viskarna är avvikare.

Ett lådagram kan genereras med matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Lådagramdata

Använd plt.boxplot(x), där x kan vara ett 1D array-liknande objekt, en 2D-array (en ruta per kolumn), eller en sekvens av 1D-arrayer.

Valfria parametrar

tick_labels är användbart för att namnge boxdiagram — särskilt vid plottning av flera arrayer.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Om en DataFrame med två numeriska kolumner skickas till boxplot() skapas två separata boxdiagram med etiketter som tilldelas automatiskt.

Note
Läs vidare

Det finns också ett flertal valfria parametrar för att anpassa lådagrammet, vilka du kan utforska i boxplot()-dokumentationen, men i praktiken använder du dem sällan.

Uppgift

Swipe to start coding

Skapa två lådagram med två stickprov från standardnormalfördelningen:

  1. Använd rätt funktion för att skapa lådagrammen.
  2. Använd listorna normal_sample_1 och normal_sample_2 (i denna ordning från vänster till höger) som data.
  3. Märk det vänstra lådagrammet som First sample och det högra som Second sample med hjälp av list.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 16
single

single

some-alt