Trovare Valori Nulli
I DataFrame spesso contengono valori mancanti, rappresentati come None
o NaN
. Quando si lavora con i DataFrame, è essenziale identificare questi valori mancanti perché possono distorcere i calcoli, portare ad analisi inaccurate e compromettere l'affidabilità dei risultati.
Affrontarli assicura l'integrità dei dati e migliora le prestazioni di attività come l'analisi statistica e il machine learning. A questo scopo, pandas offre metodi specifici.
Il primo di questi è isna()
, che restituisce un DataFrame booleano. In questo contesto, un valore True
indica un valore mancante all'interno del DataFrame, mentre un valore False
suggerisce che il valore è presente.
Per chiarezza, applicheremo questo metodo sul DataFrame animals
. Il metodo isna()
restituirà un DataFrame riempito con valori True
/False
, dove ogni valore True
rappresenta un valore mancante nel DataFrame animals
.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
Il secondo metodo è isnull()
. Si comporta in modo identico al precedente, senza alcuna differenza discernibile tra di loro.
Swipe to start coding
Ti viene dato un DataFrame
chiamato wine_data
.
- Recupera i valori mancanti in questo
DataFrame
e memorizza il risultato nella variabilemissing_values
.
Soluzione
Grazie per i tuoi commenti!