Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Filtrage des Données - Conditions de Base | Manipulation et Nettoyage des Données
Analyse de Données avec R

bookFiltrage des Données - Conditions de Base

Le filtrage est une technique puissante permettant d’isoler les lignes de données répondant à certains critères, comme la sélection des voitures diesel, des voitures coûteuses ou des véhicules à transmission manuelle. Cette méthode permet de se concentrer sur les données pertinentes pour une analyse approfondie, la création de rapports ou la visualisation.

Filtrage par catégorie

Base R

Il est possible de filtrer les lignes en appliquant une condition à une colonne spécifique. Par exemple, pour sélectionner uniquement les voitures dont le type de carburant est Diesel, utilisez l’opérateur $ pour référencer la colonne et appliquez une condition logique.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

La fonction filter() permet de passer directement la condition.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Filtrage basé sur une valeur numérique

Le filtrage des données peut également s’effectuer à l’aide de comparaisons numériques.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Conditions multiples

Base R

Il est possible de combiner des conditions à l'aide d'opérateurs logiques tels que & pour ET.

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Il est possible de passer plusieurs conditions à la fonction filter(), séparées par une virgule.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() est utilisé pour :

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 6

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4

bookFiltrage des Données - Conditions de Base

Glissez pour afficher le menu

Le filtrage est une technique puissante permettant d’isoler les lignes de données répondant à certains critères, comme la sélection des voitures diesel, des voitures coûteuses ou des véhicules à transmission manuelle. Cette méthode permet de se concentrer sur les données pertinentes pour une analyse approfondie, la création de rapports ou la visualisation.

Filtrage par catégorie

Base R

Il est possible de filtrer les lignes en appliquant une condition à une colonne spécifique. Par exemple, pour sélectionner uniquement les voitures dont le type de carburant est Diesel, utilisez l’opérateur $ pour référencer la colonne et appliquez une condition logique.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

La fonction filter() permet de passer directement la condition.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Filtrage basé sur une valeur numérique

Le filtrage des données peut également s’effectuer à l’aide de comparaisons numériques.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Conditions multiples

Base R

Il est possible de combiner des conditions à l'aide d'opérateurs logiques tels que & pour ET.

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Il est possible de passer plusieurs conditions à la fonction filter(), séparées par une virgule.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() est utilisé pour :

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 6
some-alt