Sammanfattning av Data med Lådagram
Ett boxplot är ett standardiserat sätt att visa fördelningen av data baserat på en fem-tals sammanfattning:
- Minimum (lägsta värde exklusive avvikare);
- Första kvartil (Q1) (25:e percentilen);
- Median (50:e percentilen);
- Tredje kvartil (Q3) (75:e percentilen);
- Maximum (högsta värde exklusive avvikare).
Varför använda ett boxplot?
Det är det bästa verktyget för jämförelse av fördelningar mellan grupper. Det visar direkt:
- Centraltendens: var medianlinjen är placerad;
- Spridning: hur hög är rutan? (interkvartilavståndet);
- Symmetri: ligger medianen i mitten av rutan?;
- Avvikare: finns det punkter utanför "whiskers"?
Viktiga parametrar
saturation: styr färgernas intensitet (0 till 1). Lägre värden ger mer dämpade färger;linewidth: styr tjockleken på rutans konturer och "whiskers";width: styr själva rutans bredd.
Exempel
Här är ett lådagram som analyserar "Tips"-datasetet. Observera hur prickarna som representerar avvikare visas ovanför viskarna.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisera avståndet för planeter upptäckta med olika metoder.
- Ställ in stilen på
'ticks'. Anpassa temat genom att skicka en ordbok för att ändra bakgrunden till'grey'('figure.facecolor') och färgen på axelns markeringar till'white'('xtick.color'och'ytick.color'). - Skapa ett boxplot med datasetet
planets(df):- Mappa
'distance'tillx-axeln och'method'tilly-axeln.
- Mappa
- Ange boxens
widthtill0.6. - Gör linjerna tjockare med
linewidth=2. - Dämpa färgerna avsevärt genom att sätta
saturationtill0.4. - Använd paletten
'vlag'.
- Visa diagrammet.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Fantastiskt!
Completion betyg förbättrat till 4.55
Sammanfattning av Data med Lådagram
Svep för att visa menyn
Ett boxplot är ett standardiserat sätt att visa fördelningen av data baserat på en fem-tals sammanfattning:
- Minimum (lägsta värde exklusive avvikare);
- Första kvartil (Q1) (25:e percentilen);
- Median (50:e percentilen);
- Tredje kvartil (Q3) (75:e percentilen);
- Maximum (högsta värde exklusive avvikare).
Varför använda ett boxplot?
Det är det bästa verktyget för jämförelse av fördelningar mellan grupper. Det visar direkt:
- Centraltendens: var medianlinjen är placerad;
- Spridning: hur hög är rutan? (interkvartilavståndet);
- Symmetri: ligger medianen i mitten av rutan?;
- Avvikare: finns det punkter utanför "whiskers"?
Viktiga parametrar
saturation: styr färgernas intensitet (0 till 1). Lägre värden ger mer dämpade färger;linewidth: styr tjockleken på rutans konturer och "whiskers";width: styr själva rutans bredd.
Exempel
Här är ett lådagram som analyserar "Tips"-datasetet. Observera hur prickarna som representerar avvikare visas ovanför viskarna.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisera avståndet för planeter upptäckta med olika metoder.
- Ställ in stilen på
'ticks'. Anpassa temat genom att skicka en ordbok för att ändra bakgrunden till'grey'('figure.facecolor') och färgen på axelns markeringar till'white'('xtick.color'och'ytick.color'). - Skapa ett boxplot med datasetet
planets(df):- Mappa
'distance'tillx-axeln och'method'tilly-axeln.
- Mappa
- Ange boxens
widthtill0.6. - Gör linjerna tjockare med
linewidth=2. - Dämpa färgerna avsevärt genom att sätta
saturationtill0.4. - Använd paletten
'vlag'.
- Visa diagrammet.
Lösning
Tack för dina kommentarer!
single