Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Matriisidatan Visualisointi | Osio
Practice
Projects
Quizzes & Challenges
Visat
Challenges
/
Tilastollinen Visualisointi Seabornilla

bookMatriisidatan Visualisointi

heatmap on kuvaaja, jossa datan arvot esitetään väreinä matriisissa.

Tämä on vakiotapa visualisoida korrelaatiomatriiseja (kuinka muuttujat liittyvät toisiinsa) tai aikasarjaruutuja (esim. kuukaudet vs. vuodet).

Tärkeää: toisin kuin scatterplot tai barplot, jotka käyttävät pitkiä datalistoja, heatmap vaatii datan yleensä matriisi- (2D) muodossa. Tämä saavutetaan usein käyttämällä df.pivot_table() ennen visualisointia.

Keskeiset parametrit

  • annot=True: kirjoittaa datan arvon jokaiseen soluun;
  • cmap: käytettävä värikartta (gradientti). Yleisiä vaihtoehtoja: 'viridis', 'coolwarm', 'magma';
  • fmt: merkkijonon muotoilukoodi, jolla säädetään numeroiden esitystapaa;
  • 'd': kokonaisluvut (ei desimaaleja);
  • '.2f': liukuluvut kahdella desimaalilla;
  • 'g': yleinen muoto (kompakti);
  • linewidths / linecolor: lisää selkeät reunat solujen väliin.

Esimerkki

Alla on heatmap, joka näyttää numeeristen muuttujien korrelaation tips-aineistossa.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Tehtävä

Swipe to start coding

Visualisoi vuosien aikana lentäneiden matkustajien määrä. Data on jo muotoiltu matriisiksi (upd_df) käyttämällä pivot_table-toimintoa.

  1. Aseta tyyli 'ticks'. Vaihda kuvion taustaväri 'seagreen'-väriin ('figure.facecolor').
  2. Luo lämpökartta:
    • Käytä upd_df-dataa (tämä on ensimmäinen argumentti, joten data=-määrettä ei tarvita).
    • Käytä 'viridis'-värikarttaa (cmap).
  • Näytä solujen numerot (annot=True).
  • Muotoile numerot käyttäen '0.99g' (yleinen muoto).
  • Aseta solujen välisten viivojen väri 'plum' (linecolor).
  1. Näytä kuvaaja.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 16
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

bookMatriisidatan Visualisointi

Pyyhkäise näyttääksesi valikon

heatmap on kuvaaja, jossa datan arvot esitetään väreinä matriisissa.

Tämä on vakiotapa visualisoida korrelaatiomatriiseja (kuinka muuttujat liittyvät toisiinsa) tai aikasarjaruutuja (esim. kuukaudet vs. vuodet).

Tärkeää: toisin kuin scatterplot tai barplot, jotka käyttävät pitkiä datalistoja, heatmap vaatii datan yleensä matriisi- (2D) muodossa. Tämä saavutetaan usein käyttämällä df.pivot_table() ennen visualisointia.

Keskeiset parametrit

  • annot=True: kirjoittaa datan arvon jokaiseen soluun;
  • cmap: käytettävä värikartta (gradientti). Yleisiä vaihtoehtoja: 'viridis', 'coolwarm', 'magma';
  • fmt: merkkijonon muotoilukoodi, jolla säädetään numeroiden esitystapaa;
  • 'd': kokonaisluvut (ei desimaaleja);
  • '.2f': liukuluvut kahdella desimaalilla;
  • 'g': yleinen muoto (kompakti);
  • linewidths / linecolor: lisää selkeät reunat solujen väliin.

Esimerkki

Alla on heatmap, joka näyttää numeeristen muuttujien korrelaation tips-aineistossa.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Tehtävä

Swipe to start coding

Visualisoi vuosien aikana lentäneiden matkustajien määrä. Data on jo muotoiltu matriisiksi (upd_df) käyttämällä pivot_table-toimintoa.

  1. Aseta tyyli 'ticks'. Vaihda kuvion taustaväri 'seagreen'-väriin ('figure.facecolor').
  2. Luo lämpökartta:
    • Käytä upd_df-dataa (tämä on ensimmäinen argumentti, joten data=-määrettä ei tarvita).
    • Käytä 'viridis'-värikarttaa (cmap).
  • Näytä solujen numerot (annot=True).
  • Muotoile numerot käyttäen '0.99g' (yleinen muoto).
  • Aseta solujen välisten viivojen väri 'plum' (linecolor).
  1. Näytä kuvaaja.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 16
single

single

some-alt