Erstellung Von Histogrammen
Warum Histogramme verwenden?
Histogramme werden verwendet, um die Verteilung kontinuierlicher (numerischer) Daten zu visualisieren. Sie zeigen, wie sich Daten über Bereiche (Bins) verteilen und helfen dabei:
- Schiefe, Ausreißer oder Lücken zu erkennen;
- Häufigkeitsverteilungen zu verstehen;
- Schnell einzuschätzen, ob die Daten normalverteilt sind oder nicht.
Sie eignen sich besonders für Variablen wie Preis, Laufleistung oder Alter.
Histogramm-Syntax in ggplot2
Ein Histogramm kann mit geom_histogram()
erstellt werden, wobei die x
-Variable numerisch sein muss.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Das Aussehen des Histogramms kann mit Argumenten wie bins
(Anzahl der Bins), fill
(Balkenfarbe), color
(Randfarbe) und theme
für das Styling angepasst werden.
Beispiel: Verteilung der Verkaufspreise
Ein Histogramm kann verwendet werden, um zu untersuchen, wie sich Autopreise im Datensatz verteilen. In diesem Beispiel sind die Balken stahlblau gefüllt und schwarz umrandet, während zur besseren Übersicht Beschriftungen und ein minimalistisches Theme hinzugefügt werden.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dieses Diagramm zeigt die generelle Form der Verkaufspreisverteilung und macht es einfach zu erkennen, ob die meisten Autos in einem bestimmten Preisbereich liegen oder ob es Ausreißer am oberen oder unteren Ende gibt.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4
Erstellung Von Histogrammen
Swipe um das Menü anzuzeigen
Warum Histogramme verwenden?
Histogramme werden verwendet, um die Verteilung kontinuierlicher (numerischer) Daten zu visualisieren. Sie zeigen, wie sich Daten über Bereiche (Bins) verteilen und helfen dabei:
- Schiefe, Ausreißer oder Lücken zu erkennen;
- Häufigkeitsverteilungen zu verstehen;
- Schnell einzuschätzen, ob die Daten normalverteilt sind oder nicht.
Sie eignen sich besonders für Variablen wie Preis, Laufleistung oder Alter.
Histogramm-Syntax in ggplot2
Ein Histogramm kann mit geom_histogram()
erstellt werden, wobei die x
-Variable numerisch sein muss.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Das Aussehen des Histogramms kann mit Argumenten wie bins
(Anzahl der Bins), fill
(Balkenfarbe), color
(Randfarbe) und theme
für das Styling angepasst werden.
Beispiel: Verteilung der Verkaufspreise
Ein Histogramm kann verwendet werden, um zu untersuchen, wie sich Autopreise im Datensatz verteilen. In diesem Beispiel sind die Balken stahlblau gefüllt und schwarz umrandet, während zur besseren Übersicht Beschriftungen und ein minimalistisches Theme hinzugefügt werden.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dieses Diagramm zeigt die generelle Form der Verkaufspreisverteilung und macht es einfach zu erkennen, ob die meisten Autos in einem bestimmten Preisbereich liegen oder ob es Ausreißer am oberen oder unteren Ende gibt.
Danke für Ihr Feedback!