Puuttuvien Arvojen Täyttäminen
Puuttuvien arvojen poistaminen ei ole ainoa tapa käsitellä niitä. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.
Tarkastele esimerkkiä, jossa sarakkeen 'Age' puuttuvat arvot täytetään tämän sarakkeen mediaanilla:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Selitys:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– argumentillavaluemääritetään, mitä.fillna()-metodilleNaN-arvoille tehdään. Tässä tapauksessa.fillna()-metodia sovelletaan sarakkeeseen'Age'ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;inplace=True– argumentti, jolla muutokset tallennetaan suoraan.
Swipe to start coding
Puuttuvat arvot voivat aiheuttaa ongelmia dataa analysoitaessa. Yksi yleisimmistä tavoista käsitellä niitä on korvata puuttuvat arvot sarakkeen keskiarvolla.
Tehtäväsi on:
-
Korvaa kaikki
NaN-arvot sarakkeessa'Age'kyseisen sarakkeen keskiarvolla.- Käytä
.fillna()-metodia argumenteillavalue=data['Age'].mean()jainplace=True.
- Käytä
-
Laske ja tulosta jäljellä olevien puuttuvien arvojen määrä sarakkeessa
'Age'.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Puuttuvien Arvojen Täyttäminen
Pyyhkäise näyttääksesi valikon
Puuttuvien arvojen poistaminen ei ole ainoa tapa käsitellä niitä. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.
Tarkastele esimerkkiä, jossa sarakkeen 'Age' puuttuvat arvot täytetään tämän sarakkeen mediaanilla:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Selitys:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– argumentillavaluemääritetään, mitä.fillna()-metodilleNaN-arvoille tehdään. Tässä tapauksessa.fillna()-metodia sovelletaan sarakkeeseen'Age'ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;inplace=True– argumentti, jolla muutokset tallennetaan suoraan.
Swipe to start coding
Puuttuvat arvot voivat aiheuttaa ongelmia dataa analysoitaessa. Yksi yleisimmistä tavoista käsitellä niitä on korvata puuttuvat arvot sarakkeen keskiarvolla.
Tehtäväsi on:
-
Korvaa kaikki
NaN-arvot sarakkeessa'Age'kyseisen sarakkeen keskiarvolla.- Käytä
.fillna()-metodia argumenteillavalue=data['Age'].mean()jainplace=True.
- Käytä
-
Laske ja tulosta jäljellä olevien puuttuvien arvojen määrä sarakkeessa
'Age'.
Ratkaisu
Kiitos palautteestasi!
single