Visualisering af Kategoriske Spredningsdiagrammer
Inden for statistik er en kategorisk variabel en variabel, der kan antage én af et begrænset antal mulige værdier (f.eks. "Ugedag", "Køn", "Land").
Et stripplot er i bund og grund et spredningsdiagram, hvor den ene akse repræsenterer en kategorisk variabel. Det visualiserer fordelingen af mange individuelle endimensionelle værdier.
Hvorfor bruge et Stripplot?
I modsætning til et histogram eller et tæthedsplot, som aggregerer data, viser et stripplot hver enkelt observation som en prik. Dette er ideelt til mindre datasæt, hvor man ønsker at se den præcise spredning og identificere outliers.
Centrale parametre til tilpasning
Da prikker kan overlappe hinanden (et problem kaldet "overplotting"), tilbyder stripplot flere måder at gøre dem tydelige på:
alpha: styrer gennemsigtigheden (0 til 1). Hvis denne sættes til en lav værdi (f.eks.0.25), hjælper det med at visualisere tæthed — mørkere områder betyder flere punkter;size: ændrer prikstørrelsen;marker: ændrer formen på punkterne (f.eks.'D'for diamanter,'s'for firkanter);jitter: tilføjer en smule tilfældig støj til prikpositionerne, så de ikke ligger præcis oven på hinanden (aktiveret som standard).
Live-eksempel
Her vises, hvordan man opretter et stripplot, der bruger gennemsigtighed til at håndtere overlappende data.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualisering af fordelingen af regninger pr. dag med en tilpasset stil.
- Indstil stilen til
'whitegrid'. Angiv en ordbog for at sætte baggrundsfarven ('axes.facecolor') til'aliceblue'. - Opret et stripplot ved hjælp af datasættet
tips(df):- Kortlæg
'day'tilx-aksen og'total_bill'tily-aksen. - Farv punkterne baseret på
'smoker'-status ved hjælp afhue.
- Kortlæg
- Indstil punktternes
sizetil20. - Brug paletten
'crest'. - Skift markørformen til diamanter med
marker='D'. - Indstil gennemsigtigheden
alphatil0.25.
- Vis plottet.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 4.55
Visualisering af Kategoriske Spredningsdiagrammer
Stryg for at vise menuen
Inden for statistik er en kategorisk variabel en variabel, der kan antage én af et begrænset antal mulige værdier (f.eks. "Ugedag", "Køn", "Land").
Et stripplot er i bund og grund et spredningsdiagram, hvor den ene akse repræsenterer en kategorisk variabel. Det visualiserer fordelingen af mange individuelle endimensionelle værdier.
Hvorfor bruge et Stripplot?
I modsætning til et histogram eller et tæthedsplot, som aggregerer data, viser et stripplot hver enkelt observation som en prik. Dette er ideelt til mindre datasæt, hvor man ønsker at se den præcise spredning og identificere outliers.
Centrale parametre til tilpasning
Da prikker kan overlappe hinanden (et problem kaldet "overplotting"), tilbyder stripplot flere måder at gøre dem tydelige på:
alpha: styrer gennemsigtigheden (0 til 1). Hvis denne sættes til en lav værdi (f.eks.0.25), hjælper det med at visualisere tæthed — mørkere områder betyder flere punkter;size: ændrer prikstørrelsen;marker: ændrer formen på punkterne (f.eks.'D'for diamanter,'s'for firkanter);jitter: tilføjer en smule tilfældig støj til prikpositionerne, så de ikke ligger præcis oven på hinanden (aktiveret som standard).
Live-eksempel
Her vises, hvordan man opretter et stripplot, der bruger gennemsigtighed til at håndtere overlappende data.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualisering af fordelingen af regninger pr. dag med en tilpasset stil.
- Indstil stilen til
'whitegrid'. Angiv en ordbog for at sætte baggrundsfarven ('axes.facecolor') til'aliceblue'. - Opret et stripplot ved hjælp af datasættet
tips(df):- Kortlæg
'day'tilx-aksen og'total_bill'tily-aksen. - Farv punkterne baseret på
'smoker'-status ved hjælp afhue.
- Kortlæg
- Indstil punktternes
sizetil20. - Brug paletten
'crest'. - Skift markørformen til diamanter med
marker='D'. - Indstil gennemsigtigheden
alphatil0.25.
- Vis plottet.
Løsning
Tak for dine kommentarer!
single