Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Puuttuvien Arvojen Täyttäminen | Datan Esikäsittely
Edistyneet Tekniikat Pandas-Kirjastossa

bookPuuttuvien Arvojen Täyttäminen

Puuttuvien arvojen poistaminen ei ole ainoa tapa päästä niistä eroon. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.

Tarkastele esimerkkiä, jossa sarakkeen 'Age' puuttuvat arvot täytetään tämän sarakkeen mediaaniarvolla:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Selitys:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – argumentilla value määritetään, mitä .fillna()-metodi tekee NaN-arvoille. .fillna()-metodia sovelletaan sarakkeeseen 'Age' ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;
  • inplace=True – argumentti, jolla muutokset tallennetaan suoraan.
Tehtävä

Swipe to start coding

Yksi yleisimmistä tavoista täyttää puuttuvat arvot on korvata ne sarakkeen keskiarvolla. Tehtävänäsi on siis korvata sarakkeen NaN 'Age'-arvot sarakkeen keskiarvolla (käyttäen argumenttia inplace = True). Tämän jälkeen tulosta sarakkeen 'Age' puuttuvien arvojen summa.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between using the mean and the median to fill missing values?

What are some other strategies for handling missing data?

Can you show how to fill missing values in multiple columns at once?

close

Awesome!

Completion rate improved to 3.03

bookPuuttuvien Arvojen Täyttäminen

Pyyhkäise näyttääksesi valikon

Puuttuvien arvojen poistaminen ei ole ainoa tapa päästä niistä eroon. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.

Tarkastele esimerkkiä, jossa sarakkeen 'Age' puuttuvat arvot täytetään tämän sarakkeen mediaaniarvolla:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Selitys:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – argumentilla value määritetään, mitä .fillna()-metodi tekee NaN-arvoille. .fillna()-metodia sovelletaan sarakkeeseen 'Age' ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;
  • inplace=True – argumentti, jolla muutokset tallennetaan suoraan.
Tehtävä

Swipe to start coding

Yksi yleisimmistä tavoista täyttää puuttuvat arvot on korvata ne sarakkeen keskiarvolla. Tehtävänäsi on siis korvata sarakkeen NaN 'Age'-arvot sarakkeen keskiarvolla (käyttäen argumenttia inplace = True). Tämän jälkeen tulosta sarakkeen 'Age' puuttuvien arvojen summa.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5
single

single

some-alt