Null-Arvojen Löytäminen
DataFramet sisältävät usein puuttuvia arvoja, jotka esitetään None
tai NaN
. Kun työskennellään DataFramejen kanssa, on tärkeää tunnistaa nämä puuttuvat arvot, koska ne voivat vääristää laskelmia, johtaa epätarkkoihin analyyseihin ja vaarantaa tulosten luotettavuuden.
Niiden käsittely varmistaa datan eheyden ja parantaa tehtävien, kuten tilastollisen analyysin ja koneoppimisen, suorituskykyä. Tätä tarkoitusta varten pandas tarjoaa erityisiä menetelmiä.
Ensimmäinen näistä on isna()
, joka palauttaa boolean DataFramen. Tässä yhteydessä True
-arvo osoittaa puuttuvan arvon DataFramessa, kun taas False
-arvo viittaa siihen, että arvo on läsnä.
Selkeyden vuoksi sovellamme tätä menetelmää animals
DataFrameen. isna()
-menetelmä palauttaa DataFramen, joka on täytetty True
/False
-arvoilla, missä kukin True
-arvo edustaa puuttuvaa arvoa animals
DataFramessa.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
Toinen menetelmä on isnull()
. Se käyttäytyy identtisesti edellisen kanssa, ilman havaittavaa eroa niiden välillä.
Swipe to start coding
Sinulle annetaan DataFrame
nimeltä wine_data
.
- Hae puuttuvat arvot tästä
DataFrame
:stä ja tallenna tulosmissing_values
muuttujaan.
Ratkaisu
Kiitos palautteestasi!