Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Ainutlaatuiset Arvot | Datan Analysointi
Pandas Ensimmäiset Askeleet

book
Ainutlaatuiset Arvot

Data usein monistuu DataFrameissa. Esimerkiksi countries DataFramessa 'continent' sarakkeessa on toistuvia merkintöjä. On olemassa menetelmä, joka hakee joukon erillisiä arvoja tietystä DataFrame-sarakkeesta.

import pandas as pd

country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'],
'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'],
'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(country_data)
print(countries)
1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Nyt sovellamme unique() menetelmää 'continent' ja 'country' sarakkeisiin:

import pandas as pd

country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'],
'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'],
'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(country_data)
unique_countries = countries['country'].unique()
unique_continents = countries['continent'].unique()
print(unique_countries)
print(unique_continents)
12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Laskeaksesi erillisten arvojen määrän tietyssä sarakkeessa, voit käyttää nunique()-menetelmää:

import pandas as pd

country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'],
'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'],
'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(country_data)
print(countries['continent'].nunique())
1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tehtävä

Swipe to start coding

Sinulle annetaan DataFrame nimeltä audi_cars.

  • Tunnista kaikki erilliset arvot 'year'-sarakkeessa ja tallenna tulos unique_years-sarakkeeseen.
  • Tunnista kaikki erilliset arvot 'fueltype'-sarakkeessa ja tallenna tulos unique_fueltype-muuttujaan.
  • Määritä erilaisten polttoainetyyppien määrä ja tallenna tulos count_unique_fueltypes-muuttujaan.

Ratkaisu

import pandas as pd

cars_data = {'model': ['audi A1', 'audi A6', 'audi A4', 'audi A3','audi A1'],
'year': [2017, 2016, 2017, 2019, 2016],
'fueltype': ['petrol', 'diesel', 'diesel', 'petrol', 'petrol'],
'capital': ['Manila', 'Monaco', 'Bangkok', 'Stockhol', 'Valletta']}

audi_cars = pd.DataFrame(cars_data)

# Write your code below
unique_years = audi_cars['year'].unique()
unique_fueltype = audi_cars['fueltype'].unique()
count_unique_fueltypes = audi_cars['fueltype'].nunique()

# Testing the result
print(unique_years)
print(unique_fueltype)
print(count_unique_fueltypes)
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 15
single

single

import pandas as pd

cars_data = {'model': ['audi A1', 'audi A6', 'audi A4', 'audi A3','audi A1'],
'year': [2017, 2016, 2017, 2019, 2016],
'fueltype': ['petrol', 'diesel', 'diesel', 'petrol', 'petrol'],
'capital': ['Manila', 'Monaco', 'Bangkok', 'Stockhol', 'Valletta']}

audi_cars = pd.DataFrame(cars_data)

# Write your code below
unique_years = ___
unique_fueltype = ___
count_unique_fueltypes = ___

# Testing the result
print(unique_years)
print(unique_fueltype)
print(count_unique_fueltypes)

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

some-alt