Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Datan Tiivistäminen Laatikkokaavioilla | Osio
Tilastollinen Visualisointi Seabornilla

bookDatan Tiivistäminen Laatikkokaavioilla

boxplot on vakiomuotoinen tapa esittää datan jakauma viiden luvun yhteenvedon perusteella:

  1. Minimi (alin arvo, pois lukien poikkeavat havainnot);
  2. Ensimmäinen kvartiili (Q1) (25. prosenttipiste);
  3. Mediaani (50. prosenttipiste);
  4. Kolmas kvartiili (Q3) (75. prosenttipiste);
  5. Maksimi (korkein arvo, pois lukien poikkeavat havainnot).

Miksi käyttää boxplotia?

Paras työkalu jakaumien vertailuun ryhmien välillä. Se kertoo välittömästi:

  • Keskiarvo: missä mediaaniviiva sijaitsee?;
  • Hajonta: kuinka korkea laatikko on? (kvartiiliväli);
  • Symmetria: onko mediaani laatikon keskellä?;
  • Poikkeavat havainnot: onko viiksien ulkopuolella pisteitä?

Keskeiset parametrit

  • saturation: säätää värien voimakkuutta (0–1). Pienemmät arvot tekevät väreistä hillitympiä;
  • linewidth: säätää laatikon reunojen ja viiksien paksuutta;
  • width: säätää itse laatikon leveyttä.

Esimerkki

Tässä on laatikkokaavio, joka analysoi "Tips"-datan. Huomaa, kuinka pisteet, jotka edustavat poikkeavia havaintoja, näkyvät viiksien yläpuolella.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tehtävä

Swipe to start coding

Visualisoi eri menetelmillä löydettyjen planeettojen etäisyys.

  1. Aseta tyyli arvoksi 'ticks'. Mukauta teemaa antamalla sanakirja, jossa taustan väri on 'grey' ('figure.facecolor') ja akselien asteikkoväriksi 'white' ('xtick.color' ja 'ytick.color').
  2. Luo boxplot käyttäen planets-aineistoa (df):
    • Aseta 'distance' x-akselille ja 'method' y-akselille.
  • Määritä laatikon width arvoksi 0.6.
  • Tee viivoista paksumpia käyttämällä linewidth=2.
  • Himmenna värejä merkittävästi asettamalla saturation arvoksi 0.4.
    • Käytä 'vlag'-palettia.
  1. Näytä kuvaaja.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 11
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

bookDatan Tiivistäminen Laatikkokaavioilla

Pyyhkäise näyttääksesi valikon

boxplot on vakiomuotoinen tapa esittää datan jakauma viiden luvun yhteenvedon perusteella:

  1. Minimi (alin arvo, pois lukien poikkeavat havainnot);
  2. Ensimmäinen kvartiili (Q1) (25. prosenttipiste);
  3. Mediaani (50. prosenttipiste);
  4. Kolmas kvartiili (Q3) (75. prosenttipiste);
  5. Maksimi (korkein arvo, pois lukien poikkeavat havainnot).

Miksi käyttää boxplotia?

Paras työkalu jakaumien vertailuun ryhmien välillä. Se kertoo välittömästi:

  • Keskiarvo: missä mediaaniviiva sijaitsee?;
  • Hajonta: kuinka korkea laatikko on? (kvartiiliväli);
  • Symmetria: onko mediaani laatikon keskellä?;
  • Poikkeavat havainnot: onko viiksien ulkopuolella pisteitä?

Keskeiset parametrit

  • saturation: säätää värien voimakkuutta (0–1). Pienemmät arvot tekevät väreistä hillitympiä;
  • linewidth: säätää laatikon reunojen ja viiksien paksuutta;
  • width: säätää itse laatikon leveyttä.

Esimerkki

Tässä on laatikkokaavio, joka analysoi "Tips"-datan. Huomaa, kuinka pisteet, jotka edustavat poikkeavia havaintoja, näkyvät viiksien yläpuolella.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tehtävä

Swipe to start coding

Visualisoi eri menetelmillä löydettyjen planeettojen etäisyys.

  1. Aseta tyyli arvoksi 'ticks'. Mukauta teemaa antamalla sanakirja, jossa taustan väri on 'grey' ('figure.facecolor') ja akselien asteikkoväriksi 'white' ('xtick.color' ja 'ytick.color').
  2. Luo boxplot käyttäen planets-aineistoa (df):
    • Aseta 'distance' x-akselille ja 'method' y-akselille.
  • Määritä laatikon width arvoksi 0.6.
  • Tee viivoista paksumpia käyttämällä linewidth=2.
  • Himmenna värejä merkittävästi asettamalla saturation arvoksi 0.4.
    • Käytä 'vlag'-palettia.
  1. Näytä kuvaaja.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 11
single

single

some-alt