Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Operazioni Statistiche | Matematica con NumPy
Numpy Definitivo

Scorri per mostrare il menu

book
Operazioni Statistiche

Eseguire varie operazioni statistiche su array è essenziale per l'analisi dei dati e il machine learning. NumPy fornisce funzioni e metodi per eseguirle in modo efficace.

Misure di Tendenza Centrale

Le misure di tendenza centrale rappresentano un valore centrale o rappresentativo all'interno di una distribuzione di probabilità. La maggior parte delle volte, tuttavia, calcolerai queste misure per un certo campione.

Ecco le due principali misure:

  • Media: la somma di tutti i valori divisa per il numero totale di valori;

  • Mediana: Il valore centrale in un campione ordinato.

NumPy fornisce le funzioni mean() e median() per calcolare rispettivamente la media e la mediana:

12345678
import numpy as np sample = np.array([10, 25, 15, 30, 20, 10, 2]) # Calculating the mean sample_mean = np.mean(sample) print(f'Sorted sample: {np.sort(sample)}') # Calculating the median sample_median = np.median(sample) print(f'Mean: {sample_mean}, median: {sample_median}')
copy

Abbiamo anche mostrato il campione ordinato in modo da poter vedere chiaramente la mediana. Il nostro campione ha un numero dispari di elementi (7), quindi la mediana è semplicemente l'elemento all'indice (n + 1) / 2 nel campione ordinato, dove n è la dimensione del campione.

Nota

Quando il campione ha un numero pari di elementi, la mediana è la media degli elementi agli indici n / 2 e n / 2 - 1 nel campione ordinato.

1234
import numpy as np sample = np.array([1, 2, 8, 10, 15, 20, 25, 30]) sample_median = np.median(sample) print(f'Median: {sample_median}')
copy

Il nostro campione è già ordinato e ha 8 elementi, quindi n / 2 - 1 = 3 e sample[3] è 10. n / 2 = 4 e sample[4] è 15. Pertanto, la nostra mediana è (10 + 15) / 2 = 12.5.

Misure di Dispersione

Due misure di dispersione sono la varianza e la deviazione standard. La varianza misura quanto i dati siano dispersi. È uguale alla media delle differenze quadrate di ciascun valore dalla media.

La deviazione standard è la radice quadrata della varianza. Fornisce una misura di quanto i dati siano dispersi nelle stesse unità dei dati.

NumPy ha la funzione var() per calcolare la varianza del campione e la funzione std() per calcolare la deviazione standard del campione:

1234567
import numpy as np sample = np.array([10, 25, 15, 30, 20, 10, 2]) # Calculating the variance sample_variance = np.var(sample) # Calculating the standard deviation sample_std = np.std(sample) print(f'Variance: {sample_variance}, standard deviation: {sample_std}')
copy

Calcoli in Array a Dimensioni Superiori

Tutte queste funzioni hanno un secondo parametro axis. Il suo valore predefinito è None, il che significa che la misura verrà calcolata lungo un array appiattito (anche se l'array originale è 2D o di dimensioni superiori).

È anche possibile specificare l'esatto asse lungo il quale calcolare la misura:

12345678
import numpy as np array_2d = np.array([[1, 2, 3], [4, 5, 6]]) # Calculating the mean in a flattened array print(np.mean(array_2d)) # Calculating the mean along axis 0 print(np.mean(array_2d, axis=0)) # Calculating the mean along axis 1 print(np.mean(array_2d, axis=1))
copy

L'immagine qui sotto mostra la struttura dell'array exam_scores utilizzato nel compito:

Compito

Swipe to start coding

Stai analizzando l'array exam_scores, un array 2D di punteggi di test simulati per 2 studenti (2 righe) su 5 esami diversi (5 colonne).

  1. Calcola il punteggio medio per ogni studente specificando il secondo argomento keyword.

  2. Calcola la mediana di tutti i punteggi.

  3. Calcola la varianza di tutti i punteggi.

  4. Calcola la deviazione standard di tutti i punteggi.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 3
Siamo spiacenti che qualcosa sia andato storto. Cosa è successo?

Chieda ad AI

expand
ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

book
Operazioni Statistiche

Eseguire varie operazioni statistiche su array è essenziale per l'analisi dei dati e il machine learning. NumPy fornisce funzioni e metodi per eseguirle in modo efficace.

Misure di Tendenza Centrale

Le misure di tendenza centrale rappresentano un valore centrale o rappresentativo all'interno di una distribuzione di probabilità. La maggior parte delle volte, tuttavia, calcolerai queste misure per un certo campione.

Ecco le due principali misure:

  • Media: la somma di tutti i valori divisa per il numero totale di valori;

  • Mediana: Il valore centrale in un campione ordinato.

NumPy fornisce le funzioni mean() e median() per calcolare rispettivamente la media e la mediana:

12345678
import numpy as np sample = np.array([10, 25, 15, 30, 20, 10, 2]) # Calculating the mean sample_mean = np.mean(sample) print(f'Sorted sample: {np.sort(sample)}') # Calculating the median sample_median = np.median(sample) print(f'Mean: {sample_mean}, median: {sample_median}')
copy

Abbiamo anche mostrato il campione ordinato in modo da poter vedere chiaramente la mediana. Il nostro campione ha un numero dispari di elementi (7), quindi la mediana è semplicemente l'elemento all'indice (n + 1) / 2 nel campione ordinato, dove n è la dimensione del campione.

Nota

Quando il campione ha un numero pari di elementi, la mediana è la media degli elementi agli indici n / 2 e n / 2 - 1 nel campione ordinato.

1234
import numpy as np sample = np.array([1, 2, 8, 10, 15, 20, 25, 30]) sample_median = np.median(sample) print(f'Median: {sample_median}')
copy

Il nostro campione è già ordinato e ha 8 elementi, quindi n / 2 - 1 = 3 e sample[3] è 10. n / 2 = 4 e sample[4] è 15. Pertanto, la nostra mediana è (10 + 15) / 2 = 12.5.

Misure di Dispersione

Due misure di dispersione sono la varianza e la deviazione standard. La varianza misura quanto i dati siano dispersi. È uguale alla media delle differenze quadrate di ciascun valore dalla media.

La deviazione standard è la radice quadrata della varianza. Fornisce una misura di quanto i dati siano dispersi nelle stesse unità dei dati.

NumPy ha la funzione var() per calcolare la varianza del campione e la funzione std() per calcolare la deviazione standard del campione:

1234567
import numpy as np sample = np.array([10, 25, 15, 30, 20, 10, 2]) # Calculating the variance sample_variance = np.var(sample) # Calculating the standard deviation sample_std = np.std(sample) print(f'Variance: {sample_variance}, standard deviation: {sample_std}')
copy

Calcoli in Array a Dimensioni Superiori

Tutte queste funzioni hanno un secondo parametro axis. Il suo valore predefinito è None, il che significa che la misura verrà calcolata lungo un array appiattito (anche se l'array originale è 2D o di dimensioni superiori).

È anche possibile specificare l'esatto asse lungo il quale calcolare la misura:

12345678
import numpy as np array_2d = np.array([[1, 2, 3], [4, 5, 6]]) # Calculating the mean in a flattened array print(np.mean(array_2d)) # Calculating the mean along axis 0 print(np.mean(array_2d, axis=0)) # Calculating the mean along axis 1 print(np.mean(array_2d, axis=1))
copy

L'immagine qui sotto mostra la struttura dell'array exam_scores utilizzato nel compito:

Compito

Swipe to start coding

Stai analizzando l'array exam_scores, un array 2D di punteggi di test simulati per 2 studenti (2 righe) su 5 esami diversi (5 colonne).

  1. Calcola il punteggio medio per ogni studente specificando il secondo argomento keyword.

  2. Calcola la mediana di tutti i punteggi.

  3. Calcola la varianza di tutti i punteggi.

  4. Calcola la deviazione standard di tutti i punteggi.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 3
Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Siamo spiacenti che qualcosa sia andato storto. Cosa è successo?
some-alt