Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Hitta Nullvärden | Analysera Data
Pandas Första Steg

book
Hitta Nullvärden

DataFrames innehåller ofta saknade värden, representerade som None eller NaN. När man arbetar med DataFrames är det viktigt att identifiera dessa saknade värden eftersom de kan förvränga beräkningar, leda till felaktiga analyser och kompromettera resultatens tillförlitlighet.

Att åtgärda dem säkerställer dataintegritet och förbättrar prestandan för uppgifter som statistisk analys och maskininlärning. För detta ändamål erbjuder pandas specifika metoder.

Den första av dessa är isna(), som returnerar en boolean DataFrame. I detta sammanhang indikerar ett True-värde ett saknat värde inom DataFrame, medan ett False-värde antyder att värdet finns.

För tydlighetens skull kommer vi att tillämpa denna metod på animals DataFrame. isna()-metoden kommer att returnera en DataFrame fylld med True/False-värden, där varje True-värde representerar ett saknat värde i animals DataFrame.

import pandas as pd
import numpy as np

animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None],
'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']}
animals = pd.DataFrame(animals_data)
# Find missing values
missing_values = animals.isna()
print(missing_values)
123456789
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
copy

Den andra metoden är isnull(). Den beter sig identiskt med den föregående, utan någon märkbar skillnad mellan dem.

Uppgift

Swipe to start coding

Du har fått en DataFrame som heter wine_data.

  • Hämta de saknade värdena i denna DataFrame och lagra resultatet i variabeln missing_values.

Lösning

import pandas as pd

wine_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/wine_with_nan.csv')

# Write your code below
missing_values = wine_data.isnull()

# Testing the result
print(missing_values)
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 6
import pandas as pd

wine_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/wine_with_nan.csv')

# Write your code below
missing_values = ___

# Testing the result
print(missing_values)
toggle bottom row
some-alt