Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Puuttuvien Arvojen Täyttäminen | Datan Esikäsittely
Edistyneet Tekniikat Pandas-Kirjastossa

bookPuuttuvien Arvojen Täyttäminen

Puuttuvien arvojen poistaminen ei ole ainoa tapa käsitellä niitä. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.

Tarkastele esimerkkiä, jossa sarakkeen 'Age' puuttuvat arvot täytetään tämän sarakkeen mediaanilla:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Selitys:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – argumentilla value määritetään, mitä .fillna()-metodille NaN-arvoille tehdään. Tässä tapauksessa .fillna()-metodia sovelletaan sarakkeeseen 'Age' ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;
  • inplace=True – argumentti, jolla muutokset tallennetaan suoraan.
Tehtävä

Swipe to start coding

Puuttuvat arvot voivat aiheuttaa ongelmia dataa analysoitaessa. Yksi yleisimmistä tavoista käsitellä niitä on korvata puuttuvat arvot sarakkeen keskiarvolla.

Tehtäväsi on:

  1. Korvaa kaikki NaN-arvot sarakkeessa 'Age' kyseisen sarakkeen keskiarvolla.

    • Käytä .fillna()-metodia argumenteilla value=data['Age'].mean() ja inplace=True.
  2. Laske ja tulosta jäljellä olevien puuttuvien arvojen määrä sarakkeessa 'Age'.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between using the mean and the median to fill missing values?

What are some other strategies for handling missing data?

Can you show how to fill missing values in multiple columns at once?

close

Awesome!

Completion rate improved to 3.03

bookPuuttuvien Arvojen Täyttäminen

Pyyhkäise näyttääksesi valikon

Puuttuvien arvojen poistaminen ei ole ainoa tapa käsitellä niitä. Voit myös korvata kaikki NaN-arvot määritellyllä arvolla, esimerkiksi sarakkeen keskiarvolla tai nollilla. Tämä voi olla hyödyllistä monissa tapauksissa. Opit tästä lisää kurssilla Learning Statistics with Python.

Tarkastele esimerkkiä, jossa sarakkeen 'Age' puuttuvat arvot täytetään tämän sarakkeen mediaanilla:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Selitys:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – argumentilla value määritetään, mitä .fillna()-metodille NaN-arvoille tehdään. Tässä tapauksessa .fillna()-metodia sovelletaan sarakkeeseen 'Age' ja kaikki puuttuvat arvot korvataan sarakkeen mediaanilla;
  • inplace=True – argumentti, jolla muutokset tallennetaan suoraan.
Tehtävä

Swipe to start coding

Puuttuvat arvot voivat aiheuttaa ongelmia dataa analysoitaessa. Yksi yleisimmistä tavoista käsitellä niitä on korvata puuttuvat arvot sarakkeen keskiarvolla.

Tehtäväsi on:

  1. Korvaa kaikki NaN-arvot sarakkeessa 'Age' kyseisen sarakkeen keskiarvolla.

    • Käytä .fillna()-metodia argumenteilla value=data['Age'].mean() ja inplace=True.
  2. Laske ja tulosta jäljellä olevien puuttuvien arvojen määrä sarakkeessa 'Age'.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5
single

single

some-alt