Filtern von Daten – Grundlegende Bedingungen
Swipe um das Menü anzuzeigen
Filtern ist eine leistungsstarke Technik, mit der sich Datenzeilen isolieren lassen, die bestimmte Kriterien erfüllen – wie zum Beispiel die Auswahl nur von Dieselautos, teuren Fahrzeugen oder Autos mit Schaltgetriebe. Dies ermöglicht die Konzentration auf relevante Daten für vertiefte Analysen, Berichte oder Visualisierungen.
Filtern nach Kategorie
Base R
Zeilen können gefiltert werden, indem eine Bedingung auf eine bestimmte Spalte angewendet wird. Um beispielsweise nur die Autos auszuwählen, bei denen der Kraftstofftyp Diesel ist, wird der $-Operator verwendet, um auf die Spalte zuzugreifen und eine logische Bedingung anzuwenden.
diesel_cars <- df[df$fuel == "Diesel", ]
dplyr
Mit der Funktion filter() kann die Bedingung direkt übergeben werden.
diesel_cars_dplyr <- df %>%
filter(fuel == "Diesel")
Filtern nach numerischem Wert
Daten können auch mit numerischen Vergleichen gefiltert werden.
Base R
expensive_cars <- df[df$selling_price > 500000, ]
dplyr
cheap_cars_dplyr <- df %>%
filter(selling_price < 500000)
Mehrere Bedingungen
Base R
Kombination von Bedingungen mit logischen Operatoren wie & für UND möglich.
diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]
dplyr
Mehrere Bedingungen können an die Funktion filter() übergeben werden, getrennt durch Kommas.
diesel_manual_cars_dplyr <- df %>%
filter(fuel == "Diesel", transmission == "Manual")
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen