Finne Nullverdier
DataFrames inneholder ofte manglende verdier, representert som None
eller NaN
. Når man arbeider med DataFrames, er det viktig å identifisere disse manglende verdiene fordi de kan forvrenge beregninger, føre til unøyaktige analyser og kompromittere påliteligheten av resultatene.
Å håndtere dem sikrer dataintegritet og forbedrer ytelsen til oppgaver som statistisk analyse og maskinlæring. For dette formålet tilbyr pandas spesifikke metoder.
Den første av disse er isna()
, som returnerer en boolsk DataFrame. I denne sammenhengen indikerer en True
-verdi en manglende verdi i DataFrame, mens en False
-verdi antyder at verdien er til stede.
For klarhetens skyld vil vi anvende denne metoden på animals
DataFrame. isna()
-metoden vil returnere en DataFrame fylt med True
/False
-verdier, hvor hver True
-verdi representerer en manglende verdi i animals
DataFrame.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
Den andre metoden er isnull()
. Den oppfører seg identisk med den forrige, uten merkbar forskjell mellom dem.
Swipe to start coding
Du har fått en DataFrame
kalt wine_data
.
- Hent de manglende verdiene i denne
DataFrame
og lagre resultatet i variabelenmissing_values
.
Løsning
Takk for tilbakemeldingene dine!