Aineiston Analysointi Laatikkokaavioiden Avulla
Box plot on toinen erittäin yleinen tilastollinen kaavio, jota käytetään havainnollistamaan aineiston keskilukua, hajontaa ja mahdollisia poikkeavia arvoja kvartiilien avulla.
Kvartiilit
Kvartiilit jakavat järjestetyn datan neljään yhtä suureen osaan:
- Q1 — pienimmän arvon ja mediaanin välinen keskipiste (25 % datasta sen alapuolella);
- Q2 — mediaani (50 % datasta sen alapuolella);
- Q3 — mediaanin ja suurimman arvon välinen keskipiste (75 % datasta sen alapuolella).
Boxplotin osat
- Laatikon vasen reuna esittää Q1:tä, oikea reuna esittää Q3:a;
- IQR = Q3 − Q1, esitetty laatikon leveydellä, mediaani merkitty keltaisella viivalla;
- Viikset ulottuvat kohtiin (Q1 - 1.5 \cdot IQR) ja (Q3 + 1.5 \cdot IQR);
- Viiksien ulkopuoliset pisteet ovat poikkeavia arvoja.
Laatikkokaavio voidaan luoda käyttämällä matplotlib-kirjastoa.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Laatikkokaavion tiedot
Käytä plt.boxplot(x), missä x voi olla 1-ulotteinen taulukkomuotoinen objekti, 2-ulotteinen taulukko (yksi laatikko per sarake) tai 1-ulotteisten taulukoiden jono.
Valinnaiset parametrit
tick_labels on hyödyllinen laatikkokaavioiden nimeämiseen — erityisesti, kun piirretään useita taulukoita.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Kun DataFrame, jossa on kaksi numeerista saraketta, välitetään boxplot()-funktiolle, luodaan kaksi erillistä laatikkokaaviota, joille nimet annetaan automaattisesti.
Laatikkokaavion mukauttamiseen on myös useita valinnaisia parametreja, joihin voit tutustua boxplot()-dokumentaatiosta, mutta käytännössä saatat harvoin tarvita niitä.
Swipe to start coding
Luo kaksi laatikkokaaviota käyttäen kahta otosta normaalijakaumasta:
- Käytä oikeaa funktiota laatikkokaavioiden luomiseen.
- Käytä listaa
normal_sample_1janormal_sample_2(tässä järjestyksessä vasemmalta oikealle) datana. - Nimeä vasemmanpuoleinen laatikkokaavio
First sampleja oikeanpuoleinenSecond samplekäyttäenlist-parametria.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 6.25
Aineiston Analysointi Laatikkokaavioiden Avulla
Pyyhkäise näyttääksesi valikon
Box plot on toinen erittäin yleinen tilastollinen kaavio, jota käytetään havainnollistamaan aineiston keskilukua, hajontaa ja mahdollisia poikkeavia arvoja kvartiilien avulla.
Kvartiilit
Kvartiilit jakavat järjestetyn datan neljään yhtä suureen osaan:
- Q1 — pienimmän arvon ja mediaanin välinen keskipiste (25 % datasta sen alapuolella);
- Q2 — mediaani (50 % datasta sen alapuolella);
- Q3 — mediaanin ja suurimman arvon välinen keskipiste (75 % datasta sen alapuolella).
Boxplotin osat
- Laatikon vasen reuna esittää Q1:tä, oikea reuna esittää Q3:a;
- IQR = Q3 − Q1, esitetty laatikon leveydellä, mediaani merkitty keltaisella viivalla;
- Viikset ulottuvat kohtiin (Q1 - 1.5 \cdot IQR) ja (Q3 + 1.5 \cdot IQR);
- Viiksien ulkopuoliset pisteet ovat poikkeavia arvoja.
Laatikkokaavio voidaan luoda käyttämällä matplotlib-kirjastoa.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Laatikkokaavion tiedot
Käytä plt.boxplot(x), missä x voi olla 1-ulotteinen taulukkomuotoinen objekti, 2-ulotteinen taulukko (yksi laatikko per sarake) tai 1-ulotteisten taulukoiden jono.
Valinnaiset parametrit
tick_labels on hyödyllinen laatikkokaavioiden nimeämiseen — erityisesti, kun piirretään useita taulukoita.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Kun DataFrame, jossa on kaksi numeerista saraketta, välitetään boxplot()-funktiolle, luodaan kaksi erillistä laatikkokaaviota, joille nimet annetaan automaattisesti.
Laatikkokaavion mukauttamiseen on myös useita valinnaisia parametreja, joihin voit tutustua boxplot()-dokumentaatiosta, mutta käytännössä saatat harvoin tarvita niitä.
Swipe to start coding
Luo kaksi laatikkokaaviota käyttäen kahta otosta normaalijakaumasta:
- Käytä oikeaa funktiota laatikkokaavioiden luomiseen.
- Käytä listaa
normal_sample_1janormal_sample_2(tässä järjestyksessä vasemmalta oikealle) datana. - Nimeä vasemmanpuoleinen laatikkokaavio
First sampleja oikeanpuoleinenSecond samplekäyttäenlist-parametria.
Ratkaisu
Kiitos palautteestasi!
single