Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Istogramma | Ulteriori Grafici Statistici
Quizzes & Challenges
Quizzes
Challenges
/
Visualizzazione Avanzata con Python

bookIstogramma

Note
Definizione

Gli istogrammi rappresentano la frequenza o la distribuzione di probabilità di una variabile utilizzando intervalli verticali di uguale ampiezza, spesso denominati barre.

Il modulo pyplot fornisce la funzione hist per creare istogrammi. Il parametro richiesto è il dato (x), che può essere un array o una sequenza di array. Se vengono passati più array, ciascuno viene visualizzato con un colore diverso.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a histogram plt.hist(weather_df['Seattle']) plt.show()
copy

Intervalli e Altezza

Una Series delle temperature annuali di Seattle è stata passata a hist(). Per impostazione predefinita, i dati sono suddivisi in 10 intervalli uguali tra il minimo e il massimo. Appaiono solo 9 bin perché un intervallo non contiene valori.

L'altezza del bin mostra la frequenza — quanti punti dati ricadono in ciascun intervallo.

Numero di Bin

Il parametro opzionale bins può essere un intero (numero di bin), una sequenza di estremi o una stringa. Di solito, è sufficiente specificare il numero di bin.

Una regola comune per scegliere il numero di bin è la formula di Sturges, basata sulla dimensione del campione:

bins = 1 + int(np.log2(n))

dove n è la dimensione del dataset.

Note
Approfondisci

Puoi esplorare metodi aggiuntivi per il calcolo dei bin qui.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Specifying the number of bins plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df)))) plt.show()
copy

Il numero di righe nel DataFrame è 26 (la dimensione della Series), quindi il numero risultante di intervalli è 5.

Approssimazione della Densità di Probabilità

Per approssimare una densità di probabilità, impostare density=True in hist(). In questo modo, l'altezza di ciascun intervallo è:

Altezza=mnw\text{Altezza} = \frac{m}{n \cdot w}

dove:

  • ( n ) — numero totale di valori,
  • ( m ) — conteggio nell'intervallo,
  • ( w ) — ampiezza dell'intervallo.

Questo fa sì che l'area totale dell'istogramma sia 1, corrispondente al comportamento di una PDF.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Making a histogram a probability density function approximation plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df))), density=True) plt.show()
copy

Questa fornisce un'approssimazione della funzione di densità di probabilità per i dati di temperatura.

Note
Approfondisci

Se desideri approfondire i parametri di hist(), puoi consultare la documentazione di hist().

Compito

Swipe to start coding

Creare un'approssimazione di una funzione di densità di probabilità utilizzando un campione dalla distribuzione normale standard:

  1. Utilizzare la funzione corretta per creare un istogramma.
  2. Utilizzare normal_sample come dati per l'istogramma.
  3. Specificare il numero di intervalli come secondo argomento utilizzando la formula di Sturges.
  4. Rendere l'istogramma un'approssimazione di una funzione di densità di probabilità specificando correttamente l'argomento più a destra.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 1
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain how the `density=True` parameter changes the histogram?

What does the resulting histogram tell us about the Seattle temperature data?

How can I compare histograms for Boston and Seattle on the same plot?

close

bookIstogramma

Scorri per mostrare il menu

Note
Definizione

Gli istogrammi rappresentano la frequenza o la distribuzione di probabilità di una variabile utilizzando intervalli verticali di uguale ampiezza, spesso denominati barre.

Il modulo pyplot fornisce la funzione hist per creare istogrammi. Il parametro richiesto è il dato (x), che può essere un array o una sequenza di array. Se vengono passati più array, ciascuno viene visualizzato con un colore diverso.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a histogram plt.hist(weather_df['Seattle']) plt.show()
copy

Intervalli e Altezza

Una Series delle temperature annuali di Seattle è stata passata a hist(). Per impostazione predefinita, i dati sono suddivisi in 10 intervalli uguali tra il minimo e il massimo. Appaiono solo 9 bin perché un intervallo non contiene valori.

L'altezza del bin mostra la frequenza — quanti punti dati ricadono in ciascun intervallo.

Numero di Bin

Il parametro opzionale bins può essere un intero (numero di bin), una sequenza di estremi o una stringa. Di solito, è sufficiente specificare il numero di bin.

Una regola comune per scegliere il numero di bin è la formula di Sturges, basata sulla dimensione del campione:

bins = 1 + int(np.log2(n))

dove n è la dimensione del dataset.

Note
Approfondisci

Puoi esplorare metodi aggiuntivi per il calcolo dei bin qui.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Specifying the number of bins plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df)))) plt.show()
copy

Il numero di righe nel DataFrame è 26 (la dimensione della Series), quindi il numero risultante di intervalli è 5.

Approssimazione della Densità di Probabilità

Per approssimare una densità di probabilità, impostare density=True in hist(). In questo modo, l'altezza di ciascun intervallo è:

Altezza=mnw\text{Altezza} = \frac{m}{n \cdot w}

dove:

  • ( n ) — numero totale di valori,
  • ( m ) — conteggio nell'intervallo,
  • ( w ) — ampiezza dell'intervallo.

Questo fa sì che l'area totale dell'istogramma sia 1, corrispondente al comportamento di una PDF.

12345678910
import pandas as pd import matplotlib.pyplot as plt import numpy as np url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Making a histogram a probability density function approximation plt.hist(weather_df['Seattle'], bins=1 + int(np.log2(len(weather_df))), density=True) plt.show()
copy

Questa fornisce un'approssimazione della funzione di densità di probabilità per i dati di temperatura.

Note
Approfondisci

Se desideri approfondire i parametri di hist(), puoi consultare la documentazione di hist().

Compito

Swipe to start coding

Creare un'approssimazione di una funzione di densità di probabilità utilizzando un campione dalla distribuzione normale standard:

  1. Utilizzare la funzione corretta per creare un istogramma.
  2. Utilizzare normal_sample come dati per l'istogramma.
  3. Specificare il numero di intervalli come secondo argomento utilizzando la formula di Sturges.
  4. Rendere l'istogramma un'approssimazione di una funzione di densità di probabilità specificando correttamente l'argomento più a destra.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 1
single

single

some-alt