Daten Sortieren
Swipe um das Menü anzuzeigen
Sortierung ist eine grundlegende Operation in der Datenanalyse. Sie ermöglicht es, einen Datensatz anhand von einem oder mehreren Variablen wie Preis, Kilometerstand oder Jahr zu organisieren. Dadurch wird es einfacher, Trends oder Ausreißer zu erkennen oder die Daten einfach in einer sinnvollen Reihenfolge anzuzeigen.
Sortierung in aufsteigender Reihenfolge
Base R
Mit der Funktion order() kann ein Datensatz nach Spaltenwerten sortiert werden. Standardmäßig gibt diese Funktion die Daten in aufsteigender Reihenfolge zurück.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Sortierung kann mit der Funktion arrange() durchgeführt werden, die standardmäßig aufsteigend sortiert.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Sortierung in absteigender Reihenfolge
Base R
Um in absteigender Reihenfolge zu sortieren, wird ein Minuszeichen (-) vor die Spalte innerhalb der Funktion order() gesetzt.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Die Funktion desc() kann innerhalb von arrange() verwendet werden, um die Reihenfolge umzukehren.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Sortieren nach mehreren Spalten
Es ist möglich, nach mehr als einer Spalte zu sortieren, um eine priorisierte Reihenfolge zu erstellen. Zum Beispiel kann zuerst nach Kraftstofftyp (alphabetisch) und anschließend nach Verkaufspreis in absteigender Reihenfolge sortiert werden.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen