Laatikkojuoni
Box plot on toinen erittäin yleinen tilastollinen kaavio, jota käytetään havainnollistamaan aineiston keskilukua, hajontaa ja mahdollisia poikkeavia arvoja kvartiilien avulla.
Kvartiilit
Kvartiilit jakavat järjestetyn datan neljään yhtä suureen osaan:
- Q1 — pienimmän arvon ja mediaanin välinen keskipiste (25 % datasta sen alapuolella);
- Q2 — mediaani (50 % datasta sen alapuolella);
- Q3 — mediaanin ja suurimman arvon välinen keskipiste (75 % datasta sen alapuolella).
Boxplotin osat
- Laatikon vasen puoli osoittaa Q1, oikea puoli osoittaa Q3;
- IQR = Q3 − Q1, esitetty laatikon leveydellä, mediaani merkitty keltaisella viivalla;
- Viikset ulottuvat kohtiin (Q1 - 1.5 \cdot IQR) ja (Q3 + 1.5 \cdot IQR);
- Viiksien ulkopuolella olevat pisteet ovat poikkeavia havaintoja.
Laatikkokaavio voidaan luoda käyttämällä matplotlib-kirjastoa.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Laatikon piirron data
Käytä plt.boxplot(x), jossa x voi olla 1D-taulukkomuotoinen objekti, 2D-taulukko (yksi laatikko per sarake) tai 1D-taulukoiden jono.
Valinnaiset parametrit
tick_labels on hyödyllinen laatikkokaavioiden nimeämiseen — erityisesti, kun piirretään useita taulukoita.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
DataFrame-objektin, jossa on kaksi numeerista saraketta, välittäminen boxplot()-funktiolle luo kaksi erillistä laatikkokaaviota, joille nimet asetetaan automaattisesti.
Laatikkokaavion mukauttamiseen on myös melko paljon valinnaisia parametreja, joihin voit tutustua boxplot() -dokumentaatiosta, mutta käytännössä niitä tarvitsee harvoin.
Swipe to start coding
Luo kaksi laatikkokuviota käyttäen kahta otosta normaalijakaumasta:
- Käytä oikeaa funktiota laatikkokuvioiden luomiseen.
- Käytä listaa
normal_sample_1janormal_sample_2(tässä järjestyksessä vasemmalta oikealle) datana. - Nimeä vasemmanpuoleinen laatikkokuvio
First sampleja oikeanpuoleinenSecond samplekäyttäenlist-parametria.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.85
Laatikkojuoni
Pyyhkäise näyttääksesi valikon
Box plot on toinen erittäin yleinen tilastollinen kaavio, jota käytetään havainnollistamaan aineiston keskilukua, hajontaa ja mahdollisia poikkeavia arvoja kvartiilien avulla.
Kvartiilit
Kvartiilit jakavat järjestetyn datan neljään yhtä suureen osaan:
- Q1 — pienimmän arvon ja mediaanin välinen keskipiste (25 % datasta sen alapuolella);
- Q2 — mediaani (50 % datasta sen alapuolella);
- Q3 — mediaanin ja suurimman arvon välinen keskipiste (75 % datasta sen alapuolella).
Boxplotin osat
- Laatikon vasen puoli osoittaa Q1, oikea puoli osoittaa Q3;
- IQR = Q3 − Q1, esitetty laatikon leveydellä, mediaani merkitty keltaisella viivalla;
- Viikset ulottuvat kohtiin (Q1 - 1.5 \cdot IQR) ja (Q3 + 1.5 \cdot IQR);
- Viiksien ulkopuolella olevat pisteet ovat poikkeavia havaintoja.
Laatikkokaavio voidaan luoda käyttämällä matplotlib-kirjastoa.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Laatikon piirron data
Käytä plt.boxplot(x), jossa x voi olla 1D-taulukkomuotoinen objekti, 2D-taulukko (yksi laatikko per sarake) tai 1D-taulukoiden jono.
Valinnaiset parametrit
tick_labels on hyödyllinen laatikkokaavioiden nimeämiseen — erityisesti, kun piirretään useita taulukoita.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
DataFrame-objektin, jossa on kaksi numeerista saraketta, välittäminen boxplot()-funktiolle luo kaksi erillistä laatikkokaaviota, joille nimet asetetaan automaattisesti.
Laatikkokaavion mukauttamiseen on myös melko paljon valinnaisia parametreja, joihin voit tutustua boxplot() -dokumentaatiosta, mutta käytännössä niitä tarvitsee harvoin.
Swipe to start coding
Luo kaksi laatikkokuviota käyttäen kahta otosta normaalijakaumasta:
- Käytä oikeaa funktiota laatikkokuvioiden luomiseen.
- Käytä listaa
normal_sample_1janormal_sample_2(tässä järjestyksessä vasemmalta oikealle) datana. - Nimeä vasemmanpuoleinen laatikkokuvio
First sampleja oikeanpuoleinenSecond samplekäyttäenlist-parametria.
Ratkaisu
Kiitos palautteestasi!
single