Datan Tiivistäminen Laatikkokaavioilla
boxplot on vakiomuotoinen tapa esittää datan jakauma viiden luvun yhteenvedon perusteella:
- Minimi (alin arvo, pois lukien poikkeavat havainnot);
- Ensimmäinen kvartiili (Q1) (25. prosenttipiste);
- Mediaani (50. prosenttipiste);
- Kolmas kvartiili (Q3) (75. prosenttipiste);
- Maksimi (korkein arvo, pois lukien poikkeavat havainnot).
Miksi käyttää boxplotia?
Paras työkalu jakaumien vertailuun ryhmien välillä. Se kertoo välittömästi:
- Keskiarvo: missä mediaaniviiva sijaitsee?;
- Hajonta: kuinka korkea laatikko on? (kvartiiliväli);
- Symmetria: onko mediaani laatikon keskellä?;
- Poikkeavat havainnot: onko viiksien ulkopuolella pisteitä?
Keskeiset parametrit
saturation: säätää värien voimakkuutta (0–1). Pienemmät arvot tekevät väreistä hillitympiä;linewidth: säätää laatikon reunojen ja viiksien paksuutta;width: säätää itse laatikon leveyttä.
Esimerkki
Tässä on laatikkokaavio, joka analysoi "Tips"-datan. Huomaa, kuinka pisteet, jotka edustavat poikkeavia havaintoja, näkyvät viiksien yläpuolella.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisoi eri menetelmillä löydettyjen planeettojen etäisyys.
- Aseta tyyli arvoksi
'ticks'. Mukauta teemaa antamalla sanakirja, jossa taustan väri on'grey'('figure.facecolor') ja akselien asteikkoväriksi'white'('xtick.color'ja'ytick.color'). - Luo boxplot käyttäen
planets-aineistoa (df):- Aseta
'distance'x-akselille ja'method'y-akselille.
- Aseta
- Määritä laatikon
widtharvoksi0.6. - Tee viivoista paksumpia käyttämällä
linewidth=2. - Himmenna värejä merkittävästi asettamalla
saturationarvoksi0.4.- Käytä
'vlag'-palettia.
- Käytä
- Näytä kuvaaja.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 4.55
Datan Tiivistäminen Laatikkokaavioilla
Pyyhkäise näyttääksesi valikon
boxplot on vakiomuotoinen tapa esittää datan jakauma viiden luvun yhteenvedon perusteella:
- Minimi (alin arvo, pois lukien poikkeavat havainnot);
- Ensimmäinen kvartiili (Q1) (25. prosenttipiste);
- Mediaani (50. prosenttipiste);
- Kolmas kvartiili (Q3) (75. prosenttipiste);
- Maksimi (korkein arvo, pois lukien poikkeavat havainnot).
Miksi käyttää boxplotia?
Paras työkalu jakaumien vertailuun ryhmien välillä. Se kertoo välittömästi:
- Keskiarvo: missä mediaaniviiva sijaitsee?;
- Hajonta: kuinka korkea laatikko on? (kvartiiliväli);
- Symmetria: onko mediaani laatikon keskellä?;
- Poikkeavat havainnot: onko viiksien ulkopuolella pisteitä?
Keskeiset parametrit
saturation: säätää värien voimakkuutta (0–1). Pienemmät arvot tekevät väreistä hillitympiä;linewidth: säätää laatikon reunojen ja viiksien paksuutta;width: säätää itse laatikon leveyttä.
Esimerkki
Tässä on laatikkokaavio, joka analysoi "Tips"-datan. Huomaa, kuinka pisteet, jotka edustavat poikkeavia havaintoja, näkyvät viiksien yläpuolella.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisoi eri menetelmillä löydettyjen planeettojen etäisyys.
- Aseta tyyli arvoksi
'ticks'. Mukauta teemaa antamalla sanakirja, jossa taustan väri on'grey'('figure.facecolor') ja akselien asteikkoväriksi'white'('xtick.color'ja'ytick.color'). - Luo boxplot käyttäen
planets-aineistoa (df):- Aseta
'distance'x-akselille ja'method'y-akselille.
- Aseta
- Määritä laatikon
widtharvoksi0.6. - Tee viivoista paksumpia käyttämällä
linewidth=2. - Himmenna värejä merkittävästi asettamalla
saturationarvoksi0.4.- Käytä
'vlag'-palettia.
- Käytä
- Näytä kuvaaja.
Ratkaisu
Kiitos palautteestasi!
single