Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Unike Verdier | Analysere Dataene
Quizzes & Challenges
Quizzes
Challenges
/
Introduksjon til pandas

bookUnike Verdier

Data blir ofte duplisert i DataFrames. For eksempel har kolonnen countries i 'continent' DataFrame gjentatte oppføringer. Det finnes en metode som henter ut et array med unike verdier fra en spesifikk kolonne i en DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Deretter brukes metoden unique() på kolonnene 'continent' og 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Noen ganger, i stedet for å hente ut alle unike verdier, ønsker du kanskje bare å vite hvor mange distinkte verdier som finnes i en kolonne. I slike tilfeller kan du bruke metoden nunique(). Den returnerer antallet unike oppføringer i en kolonne — ikke verdiene selv.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Oppgave

Swipe to start coding

Du har fått en DataFrame kalt audi_cars. Målet ditt er å utforske dataene og identifisere unike verdier ved hjelp av Pandas-metoder.

  1. Hent alle distinkte verdier fra 'year'-kolonnen og lagre dem i variabelen unique_years.
  2. Hent alle distinkte verdier fra 'fueltype'-kolonnen og lagre dem i variabelen unique_fueltype.
  3. Finn antall unike drivstofftyper i 'fueltype'-kolonnen ved å bruke .nunique()-metoden og lagre resultatet i variabelen count_unique_fueltypes.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 15
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

What does the output of the nunique() method look like?

Can I use nunique() on multiple columns at once?

What happens if there are missing values in the column?

close

Awesome!

Completion rate improved to 3.03

bookUnike Verdier

Sveip for å vise menyen

Data blir ofte duplisert i DataFrames. For eksempel har kolonnen countries i 'continent' DataFrame gjentatte oppføringer. Det finnes en metode som henter ut et array med unike verdier fra en spesifikk kolonne i en DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Deretter brukes metoden unique() på kolonnene 'continent' og 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Noen ganger, i stedet for å hente ut alle unike verdier, ønsker du kanskje bare å vite hvor mange distinkte verdier som finnes i en kolonne. I slike tilfeller kan du bruke metoden nunique(). Den returnerer antallet unike oppføringer i en kolonne — ikke verdiene selv.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Oppgave

Swipe to start coding

Du har fått en DataFrame kalt audi_cars. Målet ditt er å utforske dataene og identifisere unike verdier ved hjelp av Pandas-metoder.

  1. Hent alle distinkte verdier fra 'year'-kolonnen og lagre dem i variabelen unique_years.
  2. Hent alle distinkte verdier fra 'fueltype'-kolonnen og lagre dem i variabelen unique_fueltype.
  3. Finn antall unike drivstofftyper i 'fueltype'-kolonnen ved å bruke .nunique()-metoden og lagre resultatet i variabelen count_unique_fueltypes.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 15
single

single

some-alt