Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Visualisering av Kategoriska Spridningsdiagram | Sektion
Statistisk Visualisering med Seaborn

bookVisualisering av Kategoriska Spridningsdiagram

Inom statistik är en kategorisk variabel en variabel som kan anta ett av ett begränsat antal möjliga värden (t.ex. "Veckodag", "Kön", "Land").

En stripplot är i grunden ett spridningsdiagram där en av axlarna representerar en kategorisk variabel. Den visualiserar fördelningen av många individuella endimensionella värden.

Varför använda en Stripplot?

Till skillnad från ett histogram eller en täthetsplot som aggregerar data, visar en stripplot varje enskild observation som en punkt. Detta är idealiskt för mindre datamängder där du vill se den exakta spridningen och identifiera avvikare.

Viktiga parametrar för anpassning

Eftersom punkter kan överlappa varandra (ett problem som kallas "överplotting"), erbjuder stripplot flera sätt att särskilja dem:

  • alpha: styr transparensen (0 till 1). Att sätta detta till ett lågt värde (t.ex. 0.25) hjälper till att visualisera täthet — mörkare områden betyder fler punkter;
  • size: ändrar radien på punkterna;
  • marker: ändrar formen på punkterna (t.ex. 'D' för diamanter, 's' för fyrkanter);
  • jitter: lägger till en liten mängd slumpmässigt brus till punktens position så att de inte ligger exakt ovanpå varandra (aktiverat som standard).

Live-exempel

Så här skapar du en stripplot som använder transparens för att hantera överlappande data.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Uppgift

Swipe to start coding

Visualisera fördelningen av räkningar per dag med en anpassad stil.

  1. Ställ in stilen på 'whitegrid'. Skicka en ordbok för att ange bakgrundsfärgen ('axes.facecolor') till 'aliceblue'.
  2. Skapa ett stripplot med hjälp av datasettet tips (df):
    • Mappa 'day' till x-axeln och 'total_bill' till y-axeln.
    • Färglägg punkterna baserat på 'smoker'-status med hue.
  • Ange punktens size till 20.
  • Använd paletten 'crest'.
  • Ändra markörens form till diamant med marker='D'.
  • Sätt transparensen alpha till 0.25.
  1. Visa diagrammet.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 9
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

bookVisualisering av Kategoriska Spridningsdiagram

Svep för att visa menyn

Inom statistik är en kategorisk variabel en variabel som kan anta ett av ett begränsat antal möjliga värden (t.ex. "Veckodag", "Kön", "Land").

En stripplot är i grunden ett spridningsdiagram där en av axlarna representerar en kategorisk variabel. Den visualiserar fördelningen av många individuella endimensionella värden.

Varför använda en Stripplot?

Till skillnad från ett histogram eller en täthetsplot som aggregerar data, visar en stripplot varje enskild observation som en punkt. Detta är idealiskt för mindre datamängder där du vill se den exakta spridningen och identifiera avvikare.

Viktiga parametrar för anpassning

Eftersom punkter kan överlappa varandra (ett problem som kallas "överplotting"), erbjuder stripplot flera sätt att särskilja dem:

  • alpha: styr transparensen (0 till 1). Att sätta detta till ett lågt värde (t.ex. 0.25) hjälper till att visualisera täthet — mörkare områden betyder fler punkter;
  • size: ändrar radien på punkterna;
  • marker: ändrar formen på punkterna (t.ex. 'D' för diamanter, 's' för fyrkanter);
  • jitter: lägger till en liten mängd slumpmässigt brus till punktens position så att de inte ligger exakt ovanpå varandra (aktiverat som standard).

Live-exempel

Så här skapar du en stripplot som använder transparens för att hantera överlappande data.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Uppgift

Swipe to start coding

Visualisera fördelningen av räkningar per dag med en anpassad stil.

  1. Ställ in stilen på 'whitegrid'. Skicka en ordbok för att ange bakgrundsfärgen ('axes.facecolor') till 'aliceblue'.
  2. Skapa ett stripplot med hjälp av datasettet tips (df):
    • Mappa 'day' till x-axeln och 'total_bill' till y-axeln.
    • Färglägg punkterna baserat på 'smoker'-status med hue.
  • Ange punktens size till 20.
  • Använd paletten 'crest'.
  • Ändra markörens form till diamant med marker='D'.
  • Sätt transparensen alpha till 0.25.
  1. Visa diagrammet.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 9
single

single

some-alt