Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Filtern von Daten – Grundlegende Bedingungen | Datenmanipulation und -Bereinigung
Datenanalyse Mit R

bookFiltern von Daten – Grundlegende Bedingungen

Filtern ist eine leistungsstarke Technik, mit der Sie Datenzeilen isolieren können, die bestimmte Kriterien erfüllen – wie zum Beispiel nur Dieselfahrzeuge, teure Autos oder Fahrzeuge mit Schaltgetriebe auszuwählen. Dies ermöglicht es, sich auf relevante Daten für eine vertiefte Analyse, Berichterstattung oder Visualisierung zu konzentrieren.

Filtern nach Kategorie

Base R

Zeilen können gefiltert werden, indem eine Bedingung auf eine bestimmte Spalte angewendet wird. Um beispielsweise nur die Fahrzeuge auszuwählen, bei denen der Kraftstofftyp Diesel ist, verwenden Sie den $-Operator, um auf die Spalte zuzugreifen und eine logische Bedingung anzuwenden.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

Mit der Funktion filter() kann die Bedingung direkt übergeben werden.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Filtern basierend auf numerischem Wert

Daten können auch mit numerischen Vergleichen gefiltert werden.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Mehrere Bedingungen

Base R

Kombination von Bedingungen mit logischen Operatoren wie & für UND möglich.

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Mehrere Bedingungen können an die Funktion filter() übergeben werden, getrennt durch Kommas.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() wird verwendet, um:

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 4

bookFiltern von Daten – Grundlegende Bedingungen

Swipe um das Menü anzuzeigen

Filtern ist eine leistungsstarke Technik, mit der Sie Datenzeilen isolieren können, die bestimmte Kriterien erfüllen – wie zum Beispiel nur Dieselfahrzeuge, teure Autos oder Fahrzeuge mit Schaltgetriebe auszuwählen. Dies ermöglicht es, sich auf relevante Daten für eine vertiefte Analyse, Berichterstattung oder Visualisierung zu konzentrieren.

Filtern nach Kategorie

Base R

Zeilen können gefiltert werden, indem eine Bedingung auf eine bestimmte Spalte angewendet wird. Um beispielsweise nur die Fahrzeuge auszuwählen, bei denen der Kraftstofftyp Diesel ist, verwenden Sie den $-Operator, um auf die Spalte zuzugreifen und eine logische Bedingung anzuwenden.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

Mit der Funktion filter() kann die Bedingung direkt übergeben werden.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Filtern basierend auf numerischem Wert

Daten können auch mit numerischen Vergleichen gefiltert werden.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Mehrere Bedingungen

Base R

Kombination von Bedingungen mit logischen Operatoren wie & für UND möglich.

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Mehrere Bedingungen können an die Funktion filter() übergeben werden, getrennt durch Kommas.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() wird verwendet, um:

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
some-alt