Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Erstellung von Dichteplots | Datenvisualisierung
Datenanalyse Mit R

bookErstellung von Dichteplots

Warum Dichteplots verwenden?

Ein Dichteplot ist eine geglättete Version eines Histogramms. Er ist nützlich, um:

  • Die Verteilung einer numerischen Variable zu verstehen;
  • Verteilungen zwischen Gruppen (wie Kraftstoffarten) zu vergleichen;
  • Spitzen, Schiefe und Streuung zu erkennen.

Im Gegensatz zu Histogrammen schätzen Dichteplots die Wahrscheinlichkeit, dass ein Wert innerhalb eines Bereichs auftritt.

Syntax für Dichteplots in ggplot2

In ggplot2 kann ein Dichteplot mit geom_density() erstellt werden.

ggplot(data = df, aes(x = variable)) +
  geom_density()

Um Gruppen zu vergleichen, kann eine kategoriale Variable auf fill abgebildet und die Transparenz mit alpha angepasst werden, sodass sich die Kurven deutlich überlappen.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Dies erleichtert den Vergleich, wie sich die Verteilung einer numerischen Variable zwischen Kategorien unterscheidet.

Beispiel: Verteilung des Verkaufspreises

Ein Dichteplot bietet eine geglättete Darstellung der Verteilung von Autopreisen. In diesem Beispiel ist die Kurve blau ausgefüllt, und Achsenbeschriftungen verdeutlichen die Bedeutung der Werte.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Diese Visualisierung zeigt, wo sich die meisten Autopreise konzentrieren und wie breit die Preise im Datensatz gestreut sind. Sie ist besonders hilfreich, um Spitzen in der Verteilung zu erkennen und später mit anderen Variablen zu vergleichen.

question mark

Welches Argument steuert die Transparenz überlappender Dichteplots?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 4

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

What is the difference between a density plot and a histogram?

How do I interpret the peaks and tails in a density plot?

Can you explain how to compare distributions using density plots?

Awesome!

Completion rate improved to 4

bookErstellung von Dichteplots

Swipe um das Menü anzuzeigen

Warum Dichteplots verwenden?

Ein Dichteplot ist eine geglättete Version eines Histogramms. Er ist nützlich, um:

  • Die Verteilung einer numerischen Variable zu verstehen;
  • Verteilungen zwischen Gruppen (wie Kraftstoffarten) zu vergleichen;
  • Spitzen, Schiefe und Streuung zu erkennen.

Im Gegensatz zu Histogrammen schätzen Dichteplots die Wahrscheinlichkeit, dass ein Wert innerhalb eines Bereichs auftritt.

Syntax für Dichteplots in ggplot2

In ggplot2 kann ein Dichteplot mit geom_density() erstellt werden.

ggplot(data = df, aes(x = variable)) +
  geom_density()

Um Gruppen zu vergleichen, kann eine kategoriale Variable auf fill abgebildet und die Transparenz mit alpha angepasst werden, sodass sich die Kurven deutlich überlappen.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Dies erleichtert den Vergleich, wie sich die Verteilung einer numerischen Variable zwischen Kategorien unterscheidet.

Beispiel: Verteilung des Verkaufspreises

Ein Dichteplot bietet eine geglättete Darstellung der Verteilung von Autopreisen. In diesem Beispiel ist die Kurve blau ausgefüllt, und Achsenbeschriftungen verdeutlichen die Bedeutung der Werte.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Diese Visualisierung zeigt, wo sich die meisten Autopreise konzentrieren und wie breit die Preise im Datensatz gestreut sind. Sie ist besonders hilfreich, um Spitzen in der Verteilung zu erkennen und später mit anderen Variablen zu vergleichen.

question mark

Welches Argument steuert die Transparenz überlappender Dichteplots?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 4
some-alt