Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Unikke Værdier | Analysering af Data
Pandas Første Skridt

bookUnikke Værdier

Data bliver ofte duplikeret i DataFrames. For eksempel har kolonnen countries i DataFrame 'continent' gentagne værdier. Der findes en metode, der henter et array af unikke værdier fra en bestemt DataFrame-kolonne.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Anvend derefter metoden unique() på kolonnerne 'continent' og 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Nogle gange ønsker man ikke at hente alle unikke værdier, men blot vide hvor mange forskellige værdier der findes i en kolonne. I sådanne tilfælde kan du anvende metoden nunique(). Den returnerer antallet af unikke poster i en kolonne — ikke selve værdierne.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Opgave

Swipe to start coding

Du har fået en DataFrame ved navn audi_cars. Dit mål er at udforske dens data og identificere unikke værdier ved hjælp af Pandas-metoder.

  1. Hent alle forskellige værdier fra kolonnen 'year' og gem dem i variablen unique_years.
  2. Hent alle forskellige værdier fra kolonnen 'fueltype' og gem dem i variablen unique_fueltype.
  3. Bestem antallet af unikke brændstoftyper i kolonnen 'fueltype' ved at bruge .nunique()-metoden og gem resultatet i variablen count_unique_fueltypes.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 15
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

What does the output of the nunique() method look like?

Can I use nunique() on multiple columns at once?

What happens if there are missing values in the column?

close

Awesome!

Completion rate improved to 3.03

bookUnikke Værdier

Stryg for at vise menuen

Data bliver ofte duplikeret i DataFrames. For eksempel har kolonnen countries i DataFrame 'continent' gentagne værdier. Der findes en metode, der henter et array af unikke værdier fra en bestemt DataFrame-kolonne.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Anvend derefter metoden unique() på kolonnerne 'continent' og 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Nogle gange ønsker man ikke at hente alle unikke værdier, men blot vide hvor mange forskellige værdier der findes i en kolonne. I sådanne tilfælde kan du anvende metoden nunique(). Den returnerer antallet af unikke poster i en kolonne — ikke selve værdierne.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Opgave

Swipe to start coding

Du har fået en DataFrame ved navn audi_cars. Dit mål er at udforske dens data og identificere unikke værdier ved hjælp af Pandas-metoder.

  1. Hent alle forskellige værdier fra kolonnen 'year' og gem dem i variablen unique_years.
  2. Hent alle forskellige værdier fra kolonnen 'fueltype' og gem dem i variablen unique_fueltype.
  3. Bestem antallet af unikke brændstoftyper i kolonnen 'fueltype' ved at bruge .nunique()-metoden og gem resultatet i variablen count_unique_fueltypes.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 15
single

single

some-alt