Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Tietojen Yhdistäminen | Datan Poimiminen
Edistyneet Tekniikat Pandas-Kirjastossa

bookTietojen Yhdistäminen

Kuten ehkä muistat, muutama luku sitten käsiteltiin, kuinka useita ehtoja voidaan kirjoittaa samanaikaisesti. .isin()-lauseen avulla voidaan käyttää samoja sääntöjä. Esimerkiksi edellisen luvun esimerkki voisi näyttää tältä:

# The initial example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
data_extracted = data.loc[data['Manufacturer'].isin(models)]
print(data_extracted.head())

# The modified example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
condition = data['Manufacturer'].isin(models)
data_extracted = data.loc[condition]
print(data_extracted.head())

Näissä kahdessa tapauksessa tuloste on sama.

question-icon

Tässä tehtävänä on suodattaa data niin, että kolme ehtoa täyttyvät: autojen kategoriat ovat 'Sedan', 'Jeep', 'Coupe', JA autossa on nahkasisustus ('Leather_interior' == Yes), JA vaihteistotyypit ovat 'Variator' tai 'Automatic'.

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)

categories = ['Sedan', 'Jeep', 'Coupe']
gear_box = ['Variator', 'Automatic']

condition_1 = data['Category'].

(categories)
condition_2 = data['Leather_interior']
'Yes'
condition_3 = data['Gear_box_type'].


data_extracted = data.loc[condition_1
condition_2condition_3]

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain what the `.isin()` function does in this context?

What is the difference between using the condition directly in `.loc[]` and assigning it to a variable first?

Can you show more examples of using `.isin()` with different columns?

Awesome!

Completion rate improved to 3.03

bookTietojen Yhdistäminen

Pyyhkäise näyttääksesi valikon

Kuten ehkä muistat, muutama luku sitten käsiteltiin, kuinka useita ehtoja voidaan kirjoittaa samanaikaisesti. .isin()-lauseen avulla voidaan käyttää samoja sääntöjä. Esimerkiksi edellisen luvun esimerkki voisi näyttää tältä:

# The initial example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
data_extracted = data.loc[data['Manufacturer'].isin(models)]
print(data_extracted.head())

# The modified example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
condition = data['Manufacturer'].isin(models)
data_extracted = data.loc[condition]
print(data_extracted.head())

Näissä kahdessa tapauksessa tuloste on sama.

question-icon

Tässä tehtävänä on suodattaa data niin, että kolme ehtoa täyttyvät: autojen kategoriat ovat 'Sedan', 'Jeep', 'Coupe', JA autossa on nahkasisustus ('Leather_interior' == Yes), JA vaihteistotyypit ovat 'Variator' tai 'Automatic'.

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)

categories = ['Sedan', 'Jeep', 'Coupe']
gear_box = ['Variator', 'Automatic']

condition_1 = data['Category'].

(categories)
condition_2 = data['Leather_interior']
'Yes'
condition_3 = data['Gear_box_type'].


data_extracted = data.loc[condition_1
condition_2condition_3]

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 2
some-alt