Summary  
This chapter covers detecting and characterizing outliers by visualizing data distributions with density plots and computing skewness to distinguish between symmetric and skewed datasets.

General domain of usage  
Academic performance data analysis

**Uitschieters** zijn ongebruikelijke datapunten die aanzienlijk afwijken van het merendeel van de gegevens. Ze kunnen ontstaan door invoerfouten, natuurlijke variatie of zeldzame maar belangrijke gebeurtenissen. Uitschieters kunnen een aanzienlijke invloed hebben op statistische samenvattingen en modellering.

Een enkel grote uitschieter kan bijvoorbeeld het gemiddelde verhogen of de schaal van visualisaties verstoren, wat tot misleidende conclusies kan leiden.

Het begrijpen en **detecteren van uitschieters** is een cruciale stap in de gegevensvoorbewerking. Afhankelijk van het doel van de analyse kan ervoor worden gekozen om uitschieters te behouden, te transformeren of volledig te verwijderen.

## Uitschieters visualiseren met dichtheidsplots
Een dichtheidsplot geeft een vloeiende curve weer die de verdeling van een variabele toont. Piekpunten geven aan waar gegevens geconcentreerd zijn, terwijl lange staarten of geïsoleerde bulten kunnen wijzen op uitschieters of scheefheid.

```
ggplot(df, aes(x = placement_exam_marks)) +
  geom_density(fill = "lightgreen", alpha = 0.7) +
  labs(title = "Density Plot Of Placement Exam Marks",
       x = "Placement",
       y = "Density") +
  theme_minimal()
```

## Scheefheid meten
Scheefheid meet de mate van symmetrie of asymmetrie in een verdeling. Dit helpt vaststellen of een variabele uitschieters aan één zijde van de verdeling heeft.

```
skewness(df$placement_exam_marks)
```

## Interpretatie van scheefheid
- **Scheefheid ≈ 0**: ongeveer symmetrische verdeling;
- **Scheefheid > 0**: rechts-scheve verdeling;
- **Scheefheid < 0**: links-scheve verdeling;
- **Scheefheid > 1**: sterk rechts-scheve verdeling;
- **Scheefheid < -1**: sterk links-scheve verdeling.

Als een variabele een `skewness > 1` heeft, wordt deze beschouwd als:


Verkrijg praktische ervaring in data-analyse met R door te leren hoe datasets opgeschoond, getransformeerd en gevisualiseerd worden. Verken essentiële workflows zoals het selecteren en filteren van data, omgaan met ontbrekende waarden en het samenvatten van resultaten. Vergroot het vertrouwen in het voorbereiden van data voor inzichten, rapportages en diepgaandere statistische verkenning.

Verken de basisprincipes van data-analyse met R. Leer hoe u de tools installeert, datasets laadt en inspecteert, informatie selecteert en filtert, gegevens sorteert en transformeert, ontbrekende waarden verwerkt en resultaten samenvat voor diepgaandere inzichten.

Leer het maken van overtuigende visualisaties met ggplot2. Bouw staafdiagrammen, histogrammen, dichtheidsplots en spreidingsdiagrammen, en pas deze vervolgens aan en verfijn ze met opmaakopties en facettering om diepere inzichten in uw gegevens te onthullen.

Verdiep uw begrip van statistiek voor data-analyse. Toepassing van beschrijvende maten, identificatie en behandeling van uitschieters, en gebruik van correlatietechnieken met visuele hulpmiddelen zoals heatmaps en spreidingsdiagrammen om betekenisvolle relaties te ontdekken.

Introductie tot Uitschieters

Uitschieters visualiseren met dichtheidsplots

Scheefheid meten

Interpretatie van scheefheid