Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Aineiston Analysointi Laatikkokaavioiden Avulla | Osio
Practice
Projects
Quizzes & Challenges
Visat
Challenges
/
Datan Visualisointi Matplotlibilla

bookAineiston Analysointi Laatikkokaavioiden Avulla

Note
Määritelmä

Box plot on toinen erittäin yleinen tilastollinen kaavio, jota käytetään havainnollistamaan aineiston keskilukua, hajontaa ja mahdollisia poikkeavia arvoja kvartiilien avulla.

Kvartiilit

kvartiilit

Kvartiilit jakavat järjestetyn datan neljään yhtä suureen osaan:

  • Q1 — pienimmän arvon ja mediaanin välinen keskipiste (25 % datasta sen alapuolella);
  • Q2 — mediaani (50 % datasta sen alapuolella);
  • Q3 — mediaanin ja suurimman arvon välinen keskipiste (75 % datasta sen alapuolella).

Boxplotin osat

box_plot_explained
  • Laatikon vasen reuna esittää Q1:tä, oikea reuna esittää Q3:a;
  • IQR = Q3 − Q1, esitetty laatikon leveydellä, mediaani merkitty keltaisella viivalla;
  • Viikset ulottuvat kohtiin (Q1 - 1.5 \cdot IQR) ja (Q3 + 1.5 \cdot IQR);
  • Viiksien ulkopuoliset pisteet ovat poikkeavia arvoja.

Laatikkokaavio voidaan luoda käyttämällä matplotlib-kirjastoa.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Laatikko­kaavion tiedot

Käytä plt.boxplot(x), missä x voi olla 1-ulotteinen taulukkomuotoinen objekti, 2-ulotteinen taulukko (yksi laatikko per sarake) tai 1-ulotteisten taulukoiden jono.

Valinnaiset parametrit

tick_labels on hyödyllinen laatikkokaavioiden nimeämiseen — erityisesti, kun piirretään useita taulukoita.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Kun DataFrame, jossa on kaksi numeerista saraketta, välitetään boxplot()-funktiolle, luodaan kaksi erillistä laatikkokaaviota, joille nimet annetaan automaattisesti.

Note
Lisätietoa

Laatikkokaavion mukauttamiseen on myös useita valinnaisia parametreja, joihin voit tutustua boxplot()-dokumentaatiosta, mutta käytännössä saatat harvoin tarvita niitä.

Tehtävä

Swipe to start coding

Luo kaksi laatikkokaaviota käyttäen kahta otosta normaalijakaumasta:

  1. Käytä oikeaa funktiota laatikkokaavioiden luomiseen.
  2. Käytä listaa normal_sample_1 ja normal_sample_2 (tässä järjestyksessä vasemmalta oikealle) datana.
  3. Nimeä vasemmanpuoleinen laatikkokaavio First sample ja oikeanpuoleinen Second sample käyttäen list-parametria.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 16
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

bookAineiston Analysointi Laatikkokaavioiden Avulla

Pyyhkäise näyttääksesi valikon

Note
Määritelmä

Box plot on toinen erittäin yleinen tilastollinen kaavio, jota käytetään havainnollistamaan aineiston keskilukua, hajontaa ja mahdollisia poikkeavia arvoja kvartiilien avulla.

Kvartiilit

kvartiilit

Kvartiilit jakavat järjestetyn datan neljään yhtä suureen osaan:

  • Q1 — pienimmän arvon ja mediaanin välinen keskipiste (25 % datasta sen alapuolella);
  • Q2 — mediaani (50 % datasta sen alapuolella);
  • Q3 — mediaanin ja suurimman arvon välinen keskipiste (75 % datasta sen alapuolella).

Boxplotin osat

box_plot_explained
  • Laatikon vasen reuna esittää Q1:tä, oikea reuna esittää Q3:a;
  • IQR = Q3 − Q1, esitetty laatikon leveydellä, mediaani merkitty keltaisella viivalla;
  • Viikset ulottuvat kohtiin (Q1 - 1.5 \cdot IQR) ja (Q3 + 1.5 \cdot IQR);
  • Viiksien ulkopuoliset pisteet ovat poikkeavia arvoja.

Laatikkokaavio voidaan luoda käyttämällä matplotlib-kirjastoa.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Laatikko­kaavion tiedot

Käytä plt.boxplot(x), missä x voi olla 1-ulotteinen taulukkomuotoinen objekti, 2-ulotteinen taulukko (yksi laatikko per sarake) tai 1-ulotteisten taulukoiden jono.

Valinnaiset parametrit

tick_labels on hyödyllinen laatikkokaavioiden nimeämiseen — erityisesti, kun piirretään useita taulukoita.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Kun DataFrame, jossa on kaksi numeerista saraketta, välitetään boxplot()-funktiolle, luodaan kaksi erillistä laatikkokaaviota, joille nimet annetaan automaattisesti.

Note
Lisätietoa

Laatikkokaavion mukauttamiseen on myös useita valinnaisia parametreja, joihin voit tutustua boxplot()-dokumentaatiosta, mutta käytännössä saatat harvoin tarvita niitä.

Tehtävä

Swipe to start coding

Luo kaksi laatikkokaaviota käyttäen kahta otosta normaalijakaumasta:

  1. Käytä oikeaa funktiota laatikkokaavioiden luomiseen.
  2. Käytä listaa normal_sample_1 ja normal_sample_2 (tässä järjestyksessä vasemmalta oikealle) datana.
  3. Nimeä vasemmanpuoleinen laatikkokaavio First sample ja oikeanpuoleinen Second sample käyttäen list-parametria.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 16
single

single

some-alt