Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Erstellung Von Histogrammen | Datenvisualisierung
Datenanalyse Mit R

bookErstellung Von Histogrammen

Warum Histogramme verwenden?

Histogramme werden verwendet, um die Verteilung kontinuierlicher (numerischer) Daten zu visualisieren. Sie zeigen, wie sich Daten über Bereiche (Bins) verteilen und helfen dabei:

  • Schiefe, Ausreißer oder Lücken zu erkennen;
  • Häufigkeitsverteilungen zu verstehen;
  • Schnell einzuschätzen, ob die Daten normalverteilt sind oder nicht.

Sie eignen sich besonders für Variablen wie Preis, Laufleistung oder Alter.

Histogramm-Syntax in ggplot2

Ein Histogramm kann mit geom_histogram() erstellt werden, wobei die x-Variable numerisch sein muss.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Das Aussehen des Histogramms kann mit Argumenten wie bins (Anzahl der Bins), fill (Balkenfarbe), color (Randfarbe) und theme für das Styling angepasst werden.

Beispiel: Verteilung der Verkaufspreise

Ein Histogramm kann verwendet werden, um zu untersuchen, wie sich Autopreise im Datensatz verteilen. In diesem Beispiel sind die Balken stahlblau gefüllt und schwarz umrandet, während zur besseren Übersicht Beschriftungen und ein minimalistisches Theme hinzugefügt werden.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Dieses Diagramm zeigt die generelle Form der Verkaufspreisverteilung und macht es einfach zu erkennen, ob die meisten Autos in einem bestimmten Preisbereich liegen oder ob es Ausreißer am oberen oder unteren Ende gibt.

question mark

Was steuert das Argument bins in geom_histogram()?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 3

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 4

bookErstellung Von Histogrammen

Swipe um das Menü anzuzeigen

Warum Histogramme verwenden?

Histogramme werden verwendet, um die Verteilung kontinuierlicher (numerischer) Daten zu visualisieren. Sie zeigen, wie sich Daten über Bereiche (Bins) verteilen und helfen dabei:

  • Schiefe, Ausreißer oder Lücken zu erkennen;
  • Häufigkeitsverteilungen zu verstehen;
  • Schnell einzuschätzen, ob die Daten normalverteilt sind oder nicht.

Sie eignen sich besonders für Variablen wie Preis, Laufleistung oder Alter.

Histogramm-Syntax in ggplot2

Ein Histogramm kann mit geom_histogram() erstellt werden, wobei die x-Variable numerisch sein muss.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Das Aussehen des Histogramms kann mit Argumenten wie bins (Anzahl der Bins), fill (Balkenfarbe), color (Randfarbe) und theme für das Styling angepasst werden.

Beispiel: Verteilung der Verkaufspreise

Ein Histogramm kann verwendet werden, um zu untersuchen, wie sich Autopreise im Datensatz verteilen. In diesem Beispiel sind die Balken stahlblau gefüllt und schwarz umrandet, während zur besseren Übersicht Beschriftungen und ein minimalistisches Theme hinzugefügt werden.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Dieses Diagramm zeigt die generelle Form der Verkaufspreisverteilung und macht es einfach zu erkennen, ob die meisten Autos in einem bestimmten Preisbereich liegen oder ob es Ausreißer am oberen oder unteren Ende gibt.

question mark

Was steuert das Argument bins in geom_histogram()?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 3
some-alt