single
Puuttuvien Arvojen Täyttäminen
Pyyhkäise näyttääksesi valikon
Puuttuvien arvojen poistaminen ei ole ainoa tapa käsitellä niitä. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tilanteissa. Opit tästä lisää kurssilla Learning Statistics with Python.
Tarkastele esimerkkiä, jossa sarakkeen 'Age' puuttuvat arvot täytetään tämän sarakkeen mediaanilla:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Selitys:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– argumentillavaluekerrotaan.fillna()-metodille, mitä tehdäNaN-arvoille. Tässä tapauksessa käytimme.fillna()-metodia sarakkeeseen'Age'ja korvasimme kaikki puuttuvat arvot sarakkeen mediaanilla;inplace=True– argumentti, jonka avulla muutokset tallennetaan suoraan.
Pyyhkäise aloittaaksesi koodauksen
Puuttuvat arvot voivat aiheuttaa ongelmia data-analyysissä. Yksi yleisimmistä tavoista käsitellä niitä on korvata puuttuvat arvot sarakkeen keskiarvolla.
Tehtävänäsi on:
-
Korvata kaikki
NaN-arvot sarakkeessa'Age'kyseisen sarakkeen keskiarvolla.- Käytä
.fillna()-metodia argumenteillavalue=data['Age'].mean()jainplace=True.
- Käytä
-
Laske ja tulosta jäljellä olevien puuttuvien arvojen määrä sarakkeessa
'Age'.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme