Puuttuvien Arvojen Täyttäminen
Puuttuvien arvojen poistaminen ei ole ainoa tapa päästä niistä eroon. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.
Tarkastele esimerkkiä, jossa sarakkeen 'Age'
puuttuvat arvot täytetään tämän sarakkeen mediaaniarvolla:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Selitys:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– argumentillavalue
määritetään, mitä.fillna()
-metodi tekeeNaN
-arvoille..fillna()
-metodia sovelletaan sarakkeeseen'Age'
ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;inplace=True
– argumentti, jolla muutokset tallennetaan suoraan.
Swipe to start coding
Yksi yleisimmistä tavoista täyttää puuttuvat arvot on korvata ne sarakkeen keskiarvolla. Tehtävänäsi on siis korvata sarakkeen NaN
'Age'
-arvot sarakkeen keskiarvolla (käyttäen argumenttia inplace = True
). Tämän jälkeen tulosta sarakkeen 'Age'
puuttuvien arvojen summa.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Puuttuvien Arvojen Täyttäminen
Pyyhkäise näyttääksesi valikon
Puuttuvien arvojen poistaminen ei ole ainoa tapa päästä niistä eroon. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.
Tarkastele esimerkkiä, jossa sarakkeen 'Age'
puuttuvat arvot täytetään tämän sarakkeen mediaaniarvolla:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Selitys:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– argumentillavalue
määritetään, mitä.fillna()
-metodi tekeeNaN
-arvoille..fillna()
-metodia sovelletaan sarakkeeseen'Age'
ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;inplace=True
– argumentti, jolla muutokset tallennetaan suoraan.
Swipe to start coding
Yksi yleisimmistä tavoista täyttää puuttuvat arvot on korvata ne sarakkeen keskiarvolla. Tehtävänäsi on siis korvata sarakkeen NaN
'Age'
-arvot sarakkeen keskiarvolla (käyttäen argumenttia inplace = True
). Tämän jälkeen tulosta sarakkeen 'Age'
puuttuvien arvojen summa.
Ratkaisu
Kiitos palautteestasi!
single