Ainutlaatuiset Arvot
Data usein monistuu DataFrameissa. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erillistä arvoa sarakkeessa on. Tällöin voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei arvoja itsessään.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Sinulle on annettu DataFrame nimeltä audi_cars.
Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.
- Hae kaikki erilliset arvot sarakkeesta
'year'ja tallenna ne muuttujaanunique_years. - Hae kaikki erilliset arvot sarakkeesta
'fueltype'ja tallenna ne muuttujaanunique_fueltype. - Selvitä polttoainetyyppien määrä sarakkeessa
'fueltype'käyttämällä.nunique()-metodia ja tallenna tulos muuttujaancount_unique_fueltypes.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.03
Ainutlaatuiset Arvot
Pyyhkäise näyttääksesi valikon
Data usein monistuu DataFrameissa. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa menetelmä, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erillistä arvoa sarakkeessa on. Tällöin voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei arvoja itsessään.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Sinulle on annettu DataFrame nimeltä audi_cars.
Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.
- Hae kaikki erilliset arvot sarakkeesta
'year'ja tallenna ne muuttujaanunique_years. - Hae kaikki erilliset arvot sarakkeesta
'fueltype'ja tallenna ne muuttujaanunique_fueltype. - Selvitä polttoainetyyppien määrä sarakkeessa
'fueltype'käyttämällä.nunique()-metodia ja tallenna tulos muuttujaancount_unique_fueltypes.
Ratkaisu
Kiitos palautteestasi!
single