Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Visualisering af Kategoriske Spredningsdiagrammer | Sektion
Practice
Projects
Quizzes & Challenges
Quizzer
Challenges
/
Statistisk Visualisering med Seaborn

bookVisualisering af Kategoriske Spredningsdiagrammer

Inden for statistik er en kategorisk variabel en variabel, der kan antage én af et begrænset antal mulige værdier (f.eks. "Ugedag", "Køn", "Land").

Et stripplot er i bund og grund et spredningsdiagram, hvor den ene akse repræsenterer en kategorisk variabel. Det visualiserer fordelingen af mange individuelle endimensionelle værdier.

Hvorfor bruge et Stripplot?

I modsætning til et histogram eller et tæthedsplot, som aggregerer data, viser et stripplot hver enkelt observation som en prik. Dette er ideelt til mindre datasæt, hvor man ønsker at se den præcise spredning og identificere outliers.

Centrale parametre til tilpasning

Da prikker kan overlappe hinanden (et problem kaldet "overplotting"), tilbyder stripplot flere måder at gøre dem tydelige på:

  • alpha: styrer gennemsigtigheden (0 til 1). Hvis denne sættes til en lav værdi (f.eks. 0.25), hjælper det med at visualisere tæthed — mørkere områder betyder flere punkter;
  • size: ændrer prikstørrelsen;
  • marker: ændrer formen på punkterne (f.eks. 'D' for diamanter, 's' for firkanter);
  • jitter: tilføjer en smule tilfældig støj til prikpositionerne, så de ikke ligger præcis oven på hinanden (aktiveret som standard).

Live-eksempel

Her vises, hvordan man opretter et stripplot, der bruger gennemsigtighed til at håndtere overlappende data.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Opgave

Swipe to start coding

Visualisering af fordelingen af regninger pr. dag med en tilpasset stil.

  1. Indstil stilen til 'whitegrid'. Angiv en ordbog for at sætte baggrundsfarven ('axes.facecolor') til 'aliceblue'.
  2. Opret et stripplot ved hjælp af datasættet tips (df):
    • Kortlæg 'day' til x-aksen og 'total_bill' til y-aksen.
    • Farv punkterne baseret på 'smoker'-status ved hjælp af hue.
  • Indstil punktternes size til 20.
  • Brug paletten 'crest'.
  • Skift markørformen til diamanter med marker='D'.
  • Indstil gennemsigtigheden alpha til 0.25.
  1. Vis plottet.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 9
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

bookVisualisering af Kategoriske Spredningsdiagrammer

Stryg for at vise menuen

Inden for statistik er en kategorisk variabel en variabel, der kan antage én af et begrænset antal mulige værdier (f.eks. "Ugedag", "Køn", "Land").

Et stripplot er i bund og grund et spredningsdiagram, hvor den ene akse repræsenterer en kategorisk variabel. Det visualiserer fordelingen af mange individuelle endimensionelle værdier.

Hvorfor bruge et Stripplot?

I modsætning til et histogram eller et tæthedsplot, som aggregerer data, viser et stripplot hver enkelt observation som en prik. Dette er ideelt til mindre datasæt, hvor man ønsker at se den præcise spredning og identificere outliers.

Centrale parametre til tilpasning

Da prikker kan overlappe hinanden (et problem kaldet "overplotting"), tilbyder stripplot flere måder at gøre dem tydelige på:

  • alpha: styrer gennemsigtigheden (0 til 1). Hvis denne sættes til en lav værdi (f.eks. 0.25), hjælper det med at visualisere tæthed — mørkere områder betyder flere punkter;
  • size: ændrer prikstørrelsen;
  • marker: ændrer formen på punkterne (f.eks. 'D' for diamanter, 's' for firkanter);
  • jitter: tilføjer en smule tilfældig støj til prikpositionerne, så de ikke ligger præcis oven på hinanden (aktiveret som standard).

Live-eksempel

Her vises, hvordan man opretter et stripplot, der bruger gennemsigtighed til at håndtere overlappende data.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Opgave

Swipe to start coding

Visualisering af fordelingen af regninger pr. dag med en tilpasset stil.

  1. Indstil stilen til 'whitegrid'. Angiv en ordbog for at sætte baggrundsfarven ('axes.facecolor') til 'aliceblue'.
  2. Opret et stripplot ved hjælp af datasættet tips (df):
    • Kortlæg 'day' til x-aksen og 'total_bill' til y-aksen.
    • Farv punkterne baseret på 'smoker'-status ved hjælp af hue.
  • Indstil punktternes size til 20.
  • Brug paletten 'crest'.
  • Skift markørformen til diamanter med marker='D'.
  • Indstil gennemsigtigheden alpha til 0.25.
  1. Vis plottet.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 9
single

single

some-alt