Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Visualisering av Kategoriske Spredningsplott | Seksjon
Statistisk Visualisering med Seaborn

bookVisualisering av Kategoriske Spredningsplott

Innen statistikk er en kategorisk variabel en variabel som kan ha én av et begrenset antall mulige verdier (f.eks. "Ukedag", "Kjønn", "Land").

En stripplot er i hovedsak et spredningsdiagram hvor én av aksene representerer en kategorisk variabel. Den visualiserer fordelingen av mange individuelle endimensjonale verdier.

Hvorfor bruke en Stripplot?

I motsetning til et histogram eller et tetthetsdiagram som aggregerer data, viser en stripplot hver enkelt observasjon som et punkt. Dette er ideelt for mindre datasett hvor du ønsker å se den nøyaktige spredningen og identifisere uteliggere.

Viktige parametere for tilpasning

Siden punkter kan overlappe (et problem kalt "overplotting"), tilbyr stripplot flere måter å gjøre dem tydelige på:

  • alpha: styrer gjennomsiktighet (0 til 1). Å sette denne til en lav verdi (f.eks. 0.25) hjelper å visualisere tetthet — mørkere områder betyr flere punkter;
  • size: endrer radiusen på punktene;
  • marker: endrer formen på punktene (f.eks. 'D' for diamanter, 's' for firkanter);
  • jitter: legger til en liten mengde tilfeldig støy til posisjonen på punktene slik at de ikke ligger nøyaktig oppå hverandre (aktivert som standard).

Live-eksempel

Her er hvordan du lager en stripplot som bruker gjennomsiktighet for å håndtere overlappende data.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Oppgave

Swipe to start coding

Visualiser fordelingen av regninger per dag med en tilpasset stil.

  1. Sett stilen til 'whitegrid'. Send inn en ordbok for å angi bakgrunnsfargen ('axes.facecolor') til 'aliceblue'.
  2. Lag et stripplot ved å bruke datasettet tips (df):
    • Kartlegg 'day' til x-aksen og 'total_bill' til y-aksen.
    • Farg punktene basert på 'smoker'-status ved hjelp av hue.
  • Sett punkt size til 20.
  • Bruk paletten 'crest'.
  • Endre markørformen til diamanter med marker='D'.
  • Sett gjennomsiktigheten alpha til 0.25.
  1. Vis plottet.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 9
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

bookVisualisering av Kategoriske Spredningsplott

Sveip for å vise menyen

Innen statistikk er en kategorisk variabel en variabel som kan ha én av et begrenset antall mulige verdier (f.eks. "Ukedag", "Kjønn", "Land").

En stripplot er i hovedsak et spredningsdiagram hvor én av aksene representerer en kategorisk variabel. Den visualiserer fordelingen av mange individuelle endimensjonale verdier.

Hvorfor bruke en Stripplot?

I motsetning til et histogram eller et tetthetsdiagram som aggregerer data, viser en stripplot hver enkelt observasjon som et punkt. Dette er ideelt for mindre datasett hvor du ønsker å se den nøyaktige spredningen og identifisere uteliggere.

Viktige parametere for tilpasning

Siden punkter kan overlappe (et problem kalt "overplotting"), tilbyr stripplot flere måter å gjøre dem tydelige på:

  • alpha: styrer gjennomsiktighet (0 til 1). Å sette denne til en lav verdi (f.eks. 0.25) hjelper å visualisere tetthet — mørkere områder betyr flere punkter;
  • size: endrer radiusen på punktene;
  • marker: endrer formen på punktene (f.eks. 'D' for diamanter, 's' for firkanter);
  • jitter: legger til en liten mengde tilfeldig støy til posisjonen på punktene slik at de ikke ligger nøyaktig oppå hverandre (aktivert som standard).

Live-eksempel

Her er hvordan du lager en stripplot som bruker gjennomsiktighet for å håndtere overlappende data.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Oppgave

Swipe to start coding

Visualiser fordelingen av regninger per dag med en tilpasset stil.

  1. Sett stilen til 'whitegrid'. Send inn en ordbok for å angi bakgrunnsfargen ('axes.facecolor') til 'aliceblue'.
  2. Lag et stripplot ved å bruke datasettet tips (df):
    • Kartlegg 'day' til x-aksen og 'total_bill' til y-aksen.
    • Farg punktene basert på 'smoker'-status ved hjelp av hue.
  • Sett punkt size til 20.
  • Bruk paletten 'crest'.
  • Endre markørformen til diamanter med marker='D'.
  • Sett gjennomsiktigheten alpha til 0.25.
  1. Vis plottet.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 9
single

single

some-alt