Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Histogrammi | Lisää Tilastollisia Kuvaajia
Huipputason Visualisointi Pythonilla

Pyyhkäise näyttääksesi valikon

book
Histogrammi

Note
Määritelmä

Histogrammit kuvaavat muuttujan frekvenssi- tai todennäköisyysjakaumaa käyttämällä yhtälevyisiä pystysuoria pylväitä, joita kutsutaan usein palkkeiksi.

pyplot-moduuli tarjoaa hist-funktion histogrammien luomiseen. Pakollinen parametri on data (x), joka voi olla taulukko tai taulukoiden jono. Jos useita taulukoita annetaan, jokainen näytetään eri värillä.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a histogram plt.hist(weather_df['Seattle']) plt.show()
copy

Väliarvot ja Korkeus

Series-olio, joka sisältää Seattlen keskimääräiset vuotuiset lämpötilat, välitettiin hist()-funktiolle. Oletuksena data jaetaan 10 yhtä suureen väliin, jotka ulottuvat pienimmästä suurimpaan arvoon. Kuitenkin vain 9 pylvästä näkyy, koska toisessa väliarvossa ei ole yhtään havaintoa.

Kunkin pylvään korkeus vastaa oletuksena tämän välin frekvenssiä (kuinka monta kertaa arvoja esiintyy kyseisessä välissä).

Pylväiden määrä

Toinen tärkeä, mutta valinnainen parametri on bins, joka voi olla joko pylväiden määrä (kokonaisluku), pylväiden reunat määrittelevä lukujono tai merkkijono. Useimmiten pelkkä pylväiden määrän antaminen riittää.

Histogrammin pylväiden leveyden määrittämiseen on useita menetelmiä. Tässä esimerkissä käytämme Sturgesin kaavaa, joka laskee optimaalisen pylväsmäärän otoskoon perusteella:

Tässä n on data-taulukon koko.

Note
Lisätietoa

Voit tutustua muihin binien laskentamenetelmiin täällä.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Specifying the number of bins plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df)))) plt.show()
copy

Rivien määrä DataFrame:ssä on 26 (Series:n koko), joten binien lopullinen määrä on 5.

Todennäköisyystiheyden approksimaatio

Nähdäksesi todennäköisyystiheyden approksimaation, aseta density-parametri arvoksi True hist-funktiossa.

Nyt jokaisen binin korkeus lasketaan kaavalla:

Korkeus=mn×w\text{Korkeus} = \frac{m}{n \times w}

missä:

  • nn – arvojen kokonaismäärä aineistossa;

  • mm – arvojen määrä binissä;

  • ww – binin leveys.

Tämä varmistaa, että histogrammin kokonaispinta-ala on 1, mikä vastaa todennäköisyystiheysfunktion (PDF) keskeistä ominaisuutta.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Making a histogram a probability density function approximation plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df))), density=True) plt.show()
copy

Tämä antaa lämpötiladatan todennäköisyystiheysfunktion approksimaation.

Note
Lisätietoa

Jos haluat tutustua tarkemmin hist()-funktion parametreihin, voit katsoa lisätietoja hist()-dokumentaatiosta.

Tehtävä

Swipe to start coding

Luo todennäköisyystiheysfunktion approksimaatio käyttämällä otosta standardin normaalijakauman mukaan:

  1. Käytä oikeaa funktiota histogrammin luomiseen.
  2. Käytä normal_sample histogrammin datana.
  3. Määritä binien määrä toisena argumenttina Sturgesin kaavan mukaan.
  4. Tee histogrammista todennäköisyystiheysfunktion approksimaatio määrittämällä oikeanpuoleisin argumentti oikein.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 1

Kysy tekoälyä

expand
ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

book
Histogrammi

Note
Määritelmä

Histogrammit kuvaavat muuttujan frekvenssi- tai todennäköisyysjakaumaa käyttämällä yhtälevyisiä pystysuoria pylväitä, joita kutsutaan usein palkkeiksi.

pyplot-moduuli tarjoaa hist-funktion histogrammien luomiseen. Pakollinen parametri on data (x), joka voi olla taulukko tai taulukoiden jono. Jos useita taulukoita annetaan, jokainen näytetään eri värillä.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a histogram plt.hist(weather_df['Seattle']) plt.show()
copy

Väliarvot ja Korkeus

Series-olio, joka sisältää Seattlen keskimääräiset vuotuiset lämpötilat, välitettiin hist()-funktiolle. Oletuksena data jaetaan 10 yhtä suureen väliin, jotka ulottuvat pienimmästä suurimpaan arvoon. Kuitenkin vain 9 pylvästä näkyy, koska toisessa väliarvossa ei ole yhtään havaintoa.

Kunkin pylvään korkeus vastaa oletuksena tämän välin frekvenssiä (kuinka monta kertaa arvoja esiintyy kyseisessä välissä).

Pylväiden määrä

Toinen tärkeä, mutta valinnainen parametri on bins, joka voi olla joko pylväiden määrä (kokonaisluku), pylväiden reunat määrittelevä lukujono tai merkkijono. Useimmiten pelkkä pylväiden määrän antaminen riittää.

Histogrammin pylväiden leveyden määrittämiseen on useita menetelmiä. Tässä esimerkissä käytämme Sturgesin kaavaa, joka laskee optimaalisen pylväsmäärän otoskoon perusteella:

Tässä n on data-taulukon koko.

Note
Lisätietoa

Voit tutustua muihin binien laskentamenetelmiin täällä.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Specifying the number of bins plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df)))) plt.show()
copy

Rivien määrä DataFrame:ssä on 26 (Series:n koko), joten binien lopullinen määrä on 5.

Todennäköisyystiheyden approksimaatio

Nähdäksesi todennäköisyystiheyden approksimaation, aseta density-parametri arvoksi True hist-funktiossa.

Nyt jokaisen binin korkeus lasketaan kaavalla:

Korkeus=mn×w\text{Korkeus} = \frac{m}{n \times w}

missä:

  • nn – arvojen kokonaismäärä aineistossa;

  • mm – arvojen määrä binissä;

  • ww – binin leveys.

Tämä varmistaa, että histogrammin kokonaispinta-ala on 1, mikä vastaa todennäköisyystiheysfunktion (PDF) keskeistä ominaisuutta.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Making a histogram a probability density function approximation plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df))), density=True) plt.show()
copy

Tämä antaa lämpötiladatan todennäköisyystiheysfunktion approksimaation.

Note
Lisätietoa

Jos haluat tutustua tarkemmin hist()-funktion parametreihin, voit katsoa lisätietoja hist()-dokumentaatiosta.

Tehtävä

Swipe to start coding

Luo todennäköisyystiheysfunktion approksimaatio käyttämällä otosta standardin normaalijakauman mukaan:

  1. Käytä oikeaa funktiota histogrammin luomiseen.
  2. Käytä normal_sample histogrammin datana.
  3. Määritä binien määrä toisena argumenttina Sturgesin kaavan mukaan.
  4. Tee histogrammista todennäköisyystiheysfunktion approksimaatio määrittämällä oikeanpuoleisin argumentti oikein.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 1
Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Pahoittelemme, että jotain meni pieleen. Mitä tapahtui?
some-alt