Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Ainutkertaiset Arvot | Datan Analysointi
Pandas Ensimmäiset Askeleet

bookAinutkertaiset Arvot

DataFrame-taulukoissa esiintyy usein päällekkäisyyksiä. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Tietyn sarakkeen erillisten arvojen lukumäärän laskemiseen voidaan käyttää nunique()-metodia:

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä audi_cars.

  • Tunnista kaikki yksilölliset arvot sarakkeessa 'year' ja tallenna tulos sarakkeeseen unique_years.
  • Tunnista kaikki yksilölliset arvot sarakkeessa 'fueltype' ja tallenna tulos muuttujaan unique_fueltype.
  • Määritä polttoainetyyppien yksilöllisten arvojen määrä ja tallenna tulos muuttujaan count_unique_fueltypes.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 15
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.03

bookAinutkertaiset Arvot

Pyyhkäise näyttääksesi valikon

DataFrame-taulukoissa esiintyy usein päällekkäisyyksiä. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Tietyn sarakkeen erillisten arvojen lukumäärän laskemiseen voidaan käyttää nunique()-metodia:

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä audi_cars.

  • Tunnista kaikki yksilölliset arvot sarakkeessa 'year' ja tallenna tulos sarakkeeseen unique_years.
  • Tunnista kaikki yksilölliset arvot sarakkeessa 'fueltype' ja tallenna tulos muuttujaan unique_fueltype.
  • Määritä polttoainetyyppien yksilöllisten arvojen määrä ja tallenna tulos muuttujaan count_unique_fueltypes.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 15
single

single

some-alt