Hitta Nullvärden
DataFrames innehåller ofta saknade värden, representerade som None
eller NaN
. När man arbetar med DataFrames är det viktigt att identifiera dessa saknade värden eftersom de kan förvränga beräkningar, leda till felaktiga analyser och kompromettera resultatens tillförlitlighet.
Att åtgärda dem säkerställer dataintegritet och förbättrar prestandan för uppgifter som statistisk analys och maskininlärning. För detta ändamål erbjuder pandas specifika metoder.
Den första av dessa är isna()
, som returnerar en boolean DataFrame. I detta sammanhang indikerar ett True
-värde ett saknat värde inom DataFrame, medan ett False
-värde antyder att värdet finns.
För tydlighetens skull kommer vi att tillämpa denna metod på animals
DataFrame. isna()
-metoden kommer att returnera en DataFrame fylld med True
/False
-värden, där varje True
-värde representerar ett saknat värde i animals
DataFrame.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
Den andra metoden är isnull()
. Den beter sig identiskt med den föregående, utan någon märkbar skillnad mellan dem.
Swipe to start coding
Du har fått en DataFrame
som heter wine_data
.
- Hämta de saknade värdena i denna
DataFrame
och lagra resultatet i variabelnmissing_values
.
Lösning
Tack för dina kommentarer!