Finde Nullværdier
DataFrames indeholder ofte manglende værdier, repræsenteret som None
eller NaN
. Når man arbejder med DataFrames, er det vigtigt at identificere disse manglende værdier, fordi de kan forvride beregninger, føre til unøjagtige analyser og kompromittere pålideligheden af resultaterne.
At håndtere dem sikrer dataintegritet og forbedrer ydeevnen af opgaver som statistisk analyse og maskinlæring. Til dette formål tilbyder pandas specifikke metoder.
Den første af disse er isna()
, som returnerer en boolean DataFrame. I denne sammenhæng indikerer en True
værdi en manglende værdi inden for DataFrame, mens en False
værdi antyder, at værdien er til stede.
For klarhedens skyld vil vi anvende denne metode på animals
DataFrame. isna()
metoden vil returnere en DataFrame fyldt med True
/False
værdier, hvor hver True
værdi repræsenterer en manglende værdi i animals
DataFrame.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
Den anden metode er isnull()
. Den opfører sig identisk med den forrige, uden nogen mærkbar forskel mellem dem.
Swipe to start coding
Du får en DataFrame
ved navn wine_data
.
- Hent de manglende værdier i denne
DataFrame
og gem resultatet i variablenmissing_values
.
Løsning
Tak for dine kommentarer!