Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Kategoristen Hajontakuvioiden Visualisointi | Osio
Tilastollinen Visualisointi Seabornilla

bookKategoristen Hajontakuvioiden Visualisointi

Tilastotieteessä kategorinen muuttuja on muuttuja, joka voi saada vain rajallisen määrän mahdollisia arvoja (esim. "Viikonpäivä", "Sukupuoli", "Maa").

stripplot on pohjimmiltaan hajontakuvio, jossa toinen akseleista edustaa kategorista muuttujaa. Se havainnollistaa monien yksittäisten yksidimensionaalisten arvojen jakaumaa.

Miksi käyttää stripplotia?

Toisin kuin histogrammi tai tiheyskäyrä, jotka yhdistävät dataa, stripplot näyttää jokaisen yksittäisen havainnon pisteenä. Tämä sopii erityisesti pienille aineistoille, joissa halutaan nähdä tarkka jakauma ja tunnistaa poikkeavat arvot.

Tärkeimmät mukautusparametrit

Koska pisteet voivat mennä päällekkäin (ilmiö nimeltä "overplotting"), stripplot tarjoaa useita tapoja erottaa ne:

  • alpha: säätää läpinäkyvyyttä (0–1). Pieni arvo (esim. 0.25) auttaa havainnollistamaan tiheyttä — tummemmat alueet tarkoittavat enemmän pisteitä;
  • size: muuttaa pisteiden säteen;
  • marker: muuttaa pisteiden muotoa (esim. 'D' timantit, 's' neliöt);
  • jitter: lisää hieman satunnaista kohinaa pisteiden sijaintiin, jotta ne eivät ole täsmälleen päällekkäin (oletuksena käytössä).

Esimerkki

Näin luodaan stripplot, jossa läpinäkyvyyttä käytetään päällekkäisen datan havainnollistamiseen.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tehtävä

Swipe to start coding

Visualisoi laskujen jakauma päivittäin mukautetulla tyylillä.

  1. Aseta tyyli arvoon 'whitegrid'. Anna sanakirja, jossa 'axes.facecolor' asetetaan arvoon 'aliceblue'.
  2. Luo stripplot käyttäen tips-aineistoa (df):
    • Määritä x-akselille 'day' ja y-akselille 'total_bill'.
    • Väritä pisteet 'smoker'-statuksen mukaan käyttäen hue-parametria.
  • Aseta pisteen size arvoksi 20.
    • Käytä 'crest'-palettia.
  • Muuta merkin muoto marker='D'.
  • Aseta läpinäkyvyys alpha arvoksi 0.25.
  1. Näytä kuvaaja.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 9
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

bookKategoristen Hajontakuvioiden Visualisointi

Pyyhkäise näyttääksesi valikon

Tilastotieteessä kategorinen muuttuja on muuttuja, joka voi saada vain rajallisen määrän mahdollisia arvoja (esim. "Viikonpäivä", "Sukupuoli", "Maa").

stripplot on pohjimmiltaan hajontakuvio, jossa toinen akseleista edustaa kategorista muuttujaa. Se havainnollistaa monien yksittäisten yksidimensionaalisten arvojen jakaumaa.

Miksi käyttää stripplotia?

Toisin kuin histogrammi tai tiheyskäyrä, jotka yhdistävät dataa, stripplot näyttää jokaisen yksittäisen havainnon pisteenä. Tämä sopii erityisesti pienille aineistoille, joissa halutaan nähdä tarkka jakauma ja tunnistaa poikkeavat arvot.

Tärkeimmät mukautusparametrit

Koska pisteet voivat mennä päällekkäin (ilmiö nimeltä "overplotting"), stripplot tarjoaa useita tapoja erottaa ne:

  • alpha: säätää läpinäkyvyyttä (0–1). Pieni arvo (esim. 0.25) auttaa havainnollistamaan tiheyttä — tummemmat alueet tarkoittavat enemmän pisteitä;
  • size: muuttaa pisteiden säteen;
  • marker: muuttaa pisteiden muotoa (esim. 'D' timantit, 's' neliöt);
  • jitter: lisää hieman satunnaista kohinaa pisteiden sijaintiin, jotta ne eivät ole täsmälleen päällekkäin (oletuksena käytössä).

Esimerkki

Näin luodaan stripplot, jossa läpinäkyvyyttä käytetään päällekkäisen datan havainnollistamiseen.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tehtävä

Swipe to start coding

Visualisoi laskujen jakauma päivittäin mukautetulla tyylillä.

  1. Aseta tyyli arvoon 'whitegrid'. Anna sanakirja, jossa 'axes.facecolor' asetetaan arvoon 'aliceblue'.
  2. Luo stripplot käyttäen tips-aineistoa (df):
    • Määritä x-akselille 'day' ja y-akselille 'total_bill'.
    • Väritä pisteet 'smoker'-statuksen mukaan käyttäen hue-parametria.
  • Aseta pisteen size arvoksi 20.
    • Käytä 'crest'-palettia.
  • Muuta merkin muoto marker='D'.
  • Aseta läpinäkyvyys alpha arvoksi 0.25.
  1. Näytä kuvaaja.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 9
single

single

some-alt