Contenuti del Corso
Statistica con Python
Statistica con Python
4. Covarianza vs Correlazione
Statistiche con Pandas
La libreria Pandas dispone già di tre funzioni integrate per calcolare la media e la mediana. Per importare pandas
utilizzando l'alias pd
, utilizzare la seguente sintassi:
python
Ecco un esempio di calcolo di .mean()
e .median()
per la colonna 'work_year'
nel dataset denominato df
.
È possibile modificare le colonne e osservare i risultati:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculating the mean value mean = df['work_year'].mean() # Calculating the median value median = df['work_year'].median() print('The mean value is', mean) print('The median value is', median)
Per calcolare i principali valori statistici, utilizzare metodi progettati per la gestione delle misurazioni, come:
python
Tutto è chiaro?
Grazie per i tuoi commenti!
Sezione 2. Capitolo 3