Erstellung von Streudiagrammen
Warum Streudiagramme verwenden?
Ein Streudiagramm eignet sich hervorragend zur Visualisierung von Beziehungen zwischen Variablen. Es kann verwendet werden, um:
- Beziehungen zwischen zwei numerischen Variablen darzustellen;
- Muster, Cluster oder Ausreißer zu erkennen;
- Korrelationen (positiv/negativ/keine) zu untersuchen.
Syntax für Streudiagramme in ggplot2
Ein Streudiagramm kann mit geom_point()
erstellt werden. Dazu müssen die Ästhetiken für die x
- und y
-Achse angegeben werden.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Um Gruppen innerhalb der Daten zu unterscheiden, kann eine Gruppierungsvariable der color
-Ästhetik hinzugefügt werden. Dadurch werden den einzelnen Gruppen unterschiedliche Farben zugewiesen, was Muster leichter erkennbar macht.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Beispiel: Verkaufspreis vs. gefahrene Kilometer
Ein Streudiagramm kann verwendet werden, um zu untersuchen, wie die Nutzung eines Autos mit seinem Verkaufspreis zusammenhängt. In diesem Beispiel zeigt die x-Achse die Anzahl der gefahrenen Kilometer, während die y-Achse den Verkaufspreis darstellt.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Diese Visualisierung hebt häufig Abschreibungstrends hervor – mit zunehmender Laufleistung sinkt der Verkaufspreis in der Regel. Sie kann auch Ausreißer aufzeigen, etwa Autos mit ungewöhnlich hohen Preisen trotz hoher Laufleistung.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain how to interpret a scatter plot?
What does a negative correlation look like on a scatter plot?
How can I identify outliers using a scatter plot?
Awesome!
Completion rate improved to 4
Erstellung von Streudiagrammen
Swipe um das Menü anzuzeigen
Warum Streudiagramme verwenden?
Ein Streudiagramm eignet sich hervorragend zur Visualisierung von Beziehungen zwischen Variablen. Es kann verwendet werden, um:
- Beziehungen zwischen zwei numerischen Variablen darzustellen;
- Muster, Cluster oder Ausreißer zu erkennen;
- Korrelationen (positiv/negativ/keine) zu untersuchen.
Syntax für Streudiagramme in ggplot2
Ein Streudiagramm kann mit geom_point()
erstellt werden. Dazu müssen die Ästhetiken für die x
- und y
-Achse angegeben werden.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Um Gruppen innerhalb der Daten zu unterscheiden, kann eine Gruppierungsvariable der color
-Ästhetik hinzugefügt werden. Dadurch werden den einzelnen Gruppen unterschiedliche Farben zugewiesen, was Muster leichter erkennbar macht.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Beispiel: Verkaufspreis vs. gefahrene Kilometer
Ein Streudiagramm kann verwendet werden, um zu untersuchen, wie die Nutzung eines Autos mit seinem Verkaufspreis zusammenhängt. In diesem Beispiel zeigt die x-Achse die Anzahl der gefahrenen Kilometer, während die y-Achse den Verkaufspreis darstellt.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Diese Visualisierung hebt häufig Abschreibungstrends hervor – mit zunehmender Laufleistung sinkt der Verkaufspreis in der Regel. Sie kann auch Ausreißer aufzeigen, etwa Autos mit ungewöhnlich hohen Preisen trotz hoher Laufleistung.
Danke für Ihr Feedback!