Nullwaarden Vinden
DataFrames bevatten vaak ontbrekende waarden, weergegeven als None
of NaN
. Bij het werken met DataFrames is het essentieel om deze ontbrekende waarden te identificeren, omdat ze berekeningen kunnen verstoren, tot onnauwkeurige analyses kunnen leiden en de betrouwbaarheid van resultaten kunnen aantasten.
Het aanpakken ervan zorgt voor gegevensintegriteit en verbetert de prestaties van taken zoals statistische analyse en machine learning. Voor dit doel biedt pandas specifieke methoden.
De eerste hiervan is isna()
, die een booleaanse DataFrame retourneert. In deze context geeft een True
-waarde een ontbrekende waarde binnen de DataFrame aan, terwijl een False
-waarde suggereert dat de waarde aanwezig is.
Voor de duidelijkheid zullen we deze methode toepassen op de animals
DataFrame. De isna()
-methode retourneert een DataFrame gevuld met True
/False
-waarden, waarbij elke True
-waarde een ontbrekende waarde in de animals
DataFrame vertegenwoordigt.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
De tweede methode is isnull()
. Het gedraagt zich identiek aan de vorige, zonder merkbaar verschil tussen hen.
Swipe to start coding
Je hebt een DataFrame
genaamd wine_data
.
- Haal de ontbrekende waarden in dit
DataFrame
op en sla het resultaat op in de variabelemissing_values
.
Oplossing
Bedankt voor je feedback!