Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Ainutlaatuiset Arvot | Datan Analysointi
Johdanto Pandas-kirjastoon

bookAinutlaatuiset Arvot

DataFrame-taulukoissa esiintyy usein päällekkäisyyksiä. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Seuraavaksi käytä unique()-metodia 'continent'- ja 'country'-sarakkeisiin:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erillistä arvoa sarakkeessa on. Näissä tapauksissa voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei itse arvoja.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä audi_cars. Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.

  1. Hae kaikki erilliset arvot sarakkeesta 'year' ja tallenna ne muuttujaan unique_years.
  2. Hae kaikki erilliset arvot sarakkeesta 'fueltype' ja tallenna ne muuttujaan unique_fueltype.
  3. Selvitä polttoainetyyppien määrä sarakkeessa 'fueltype' käyttämällä .nunique()-metodia ja tallenna tulos muuttujaan count_unique_fueltypes.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 15
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What does the output of the nunique() method look like?

Can I use nunique() on multiple columns at once?

What happens if there are missing values in the column?

close

bookAinutlaatuiset Arvot

Pyyhkäise näyttääksesi valikon

DataFrame-taulukoissa esiintyy usein päällekkäisyyksiä. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Seuraavaksi käytä unique()-metodia 'continent'- ja 'country'-sarakkeisiin:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erillistä arvoa sarakkeessa on. Näissä tapauksissa voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei itse arvoja.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä audi_cars. Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.

  1. Hae kaikki erilliset arvot sarakkeesta 'year' ja tallenna ne muuttujaan unique_years.
  2. Hae kaikki erilliset arvot sarakkeesta 'fueltype' ja tallenna ne muuttujaan unique_fueltype.
  3. Selvitä polttoainetyyppien määrä sarakkeessa 'fueltype' käyttämällä .nunique()-metodia ja tallenna tulos muuttujaan count_unique_fueltypes.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 15
single

single

some-alt