Daten Sortieren
Sortieren ist eine grundlegende Operation in der Datenanalyse. Sie ermöglicht es, einen Datensatz anhand einer oder mehrerer Variablen – wie Preis, Kilometerstand oder Jahr – zu organisieren. Dadurch wird es einfacher, Trends oder Ausreißer zu erkennen oder die Daten einfach in einer sinnvollen Reihenfolge anzuzeigen.
Sortieren in aufsteigender Reihenfolge
Base R
Mit der Funktion order()
können Sie einen Datensatz nach Spaltenwerten sortieren. Standardmäßig gibt diese Funktion die Daten in aufsteigender Reihenfolge zurück.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Sortieren kann mit der Funktion arrange()
durchgeführt werden, die standardmäßig aufsteigend sortiert.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Sortieren in absteigender Reihenfolge
Base R
Um in absteigender Reihenfolge zu sortieren, wird ein Minuszeichen (-
) vor die Spalte in der Funktion order()
gesetzt.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Die Funktion desc()
kann innerhalb von arrange()
verwendet werden, um die Reihenfolge umzukehren.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Sortieren nach mehreren Spalten
Es ist möglich, nach mehr als einer Spalte zu sortieren, um eine priorisierte Reihenfolge zu erstellen. Beispielsweise kann zuerst nach Kraftstofftyp (alphabetisch) und anschließend nach Verkaufspreis in absteigender Reihenfolge sortiert werden.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain the difference between sorting with base R and dplyr?
How do I sort by more than two columns?
What should I do if my column contains missing values when sorting?
Awesome!
Completion rate improved to 4
Daten Sortieren
Swipe um das Menü anzuzeigen
Sortieren ist eine grundlegende Operation in der Datenanalyse. Sie ermöglicht es, einen Datensatz anhand einer oder mehrerer Variablen – wie Preis, Kilometerstand oder Jahr – zu organisieren. Dadurch wird es einfacher, Trends oder Ausreißer zu erkennen oder die Daten einfach in einer sinnvollen Reihenfolge anzuzeigen.
Sortieren in aufsteigender Reihenfolge
Base R
Mit der Funktion order()
können Sie einen Datensatz nach Spaltenwerten sortieren. Standardmäßig gibt diese Funktion die Daten in aufsteigender Reihenfolge zurück.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Sortieren kann mit der Funktion arrange()
durchgeführt werden, die standardmäßig aufsteigend sortiert.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Sortieren in absteigender Reihenfolge
Base R
Um in absteigender Reihenfolge zu sortieren, wird ein Minuszeichen (-
) vor die Spalte in der Funktion order()
gesetzt.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Die Funktion desc()
kann innerhalb von arrange()
verwendet werden, um die Reihenfolge umzukehren.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Sortieren nach mehreren Spalten
Es ist möglich, nach mehr als einer Spalte zu sortieren, um eine priorisierte Reihenfolge zu erstellen. Beispielsweise kann zuerst nach Kraftstofftyp (alphabetisch) und anschließend nach Verkaufspreis in absteigender Reihenfolge sortiert werden.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Danke für Ihr Feedback!