Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Ainutlaatuiset Arvot | Datan Analysointi
Pandas Ensimmäiset Askeleet

bookAinutlaatuiset Arvot

Data usein monistuu DataFrameissa. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erillistä arvoa sarakkeessa on. Tällöin voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei arvoja itsessään.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä audi_cars. Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.

  1. Hae kaikki erilliset arvot sarakkeesta 'year' ja tallenna ne muuttujaan unique_years.
  2. Hae kaikki erilliset arvot sarakkeesta 'fueltype' ja tallenna ne muuttujaan unique_fueltype.
  3. Selvitä polttoainetyyppien määrä sarakkeessa 'fueltype' käyttämällä .nunique()-metodia ja tallenna tulos muuttujaan count_unique_fueltypes.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 15
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.03

bookAinutlaatuiset Arvot

Pyyhkäise näyttääksesi valikon

Data usein monistuu DataFrameissa. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erillistä arvoa sarakkeessa on. Tällöin voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei arvoja itsessään.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä audi_cars. Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.

  1. Hae kaikki erilliset arvot sarakkeesta 'year' ja tallenna ne muuttujaan unique_years.
  2. Hae kaikki erilliset arvot sarakkeesta 'fueltype' ja tallenna ne muuttujaan unique_fueltype.
  3. Selvitä polttoainetyyppien määrä sarakkeessa 'fueltype' käyttämällä .nunique()-metodia ja tallenna tulos muuttujaan count_unique_fueltypes.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 15
single

single

some-alt