Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Tri des données | Manipulation et Nettoyage des Données
Analyse de Données avec R

bookTri des données

Le tri est une opération fondamentale en analyse de données. Il permet d'organiser votre jeu de données en fonction d'une ou plusieurs variables - telles que le prix, le kilométrage ou l'année. Cela facilite l'identification des tendances, des valeurs aberrantes, ou tout simplement la visualisation des données dans un ordre pertinent.

Tri par ordre croissant

Base R

La fonction order() permet de trier un jeu de données selon les valeurs d'une colonne. Par défaut, elle retourne les données par ordre croissant.

df_sorted_price_base <- df[order(df$selling_price), ]

dplyr

Le tri peut être effectué à l'aide de la fonction arrange(), qui utilise également l'ordre croissant par défaut.

df_sorted_price_dplyr <- df %>%
  arrange(selling_price)

Tri par ordre décroissant

Base R

Pour trier par ordre décroissant, placer un signe négatif (-) devant la colonne à l'intérieur de la fonction order().

df_sorted_price_desc <- df[order(-df$selling_price), ]

dplyr

Vous pouvez utiliser la fonction desc() à l'intérieur de arrange() pour inverser l'ordre.

sorted_price_desc_dplyr <- df %>%
  arrange(desc(selling_price))

Tri par plusieurs colonnes

Il est possible de trier selon plusieurs colonnes afin de créer un ordre priorisé. Par exemple, il est possible de trier d'abord par type de carburant (ordre alphabétique), puis par prix de vente en ordre décroissant.

Base R

df_sorted <- df[order(df$fuel, -df$selling_price), ]

dplyr

df_sorted_dplyr <- df %>%
  arrange(fuel, desc(selling_price))
question mark

Que fait order(df$selling_price) ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 8

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4

bookTri des données

Glissez pour afficher le menu

Le tri est une opération fondamentale en analyse de données. Il permet d'organiser votre jeu de données en fonction d'une ou plusieurs variables - telles que le prix, le kilométrage ou l'année. Cela facilite l'identification des tendances, des valeurs aberrantes, ou tout simplement la visualisation des données dans un ordre pertinent.

Tri par ordre croissant

Base R

La fonction order() permet de trier un jeu de données selon les valeurs d'une colonne. Par défaut, elle retourne les données par ordre croissant.

df_sorted_price_base <- df[order(df$selling_price), ]

dplyr

Le tri peut être effectué à l'aide de la fonction arrange(), qui utilise également l'ordre croissant par défaut.

df_sorted_price_dplyr <- df %>%
  arrange(selling_price)

Tri par ordre décroissant

Base R

Pour trier par ordre décroissant, placer un signe négatif (-) devant la colonne à l'intérieur de la fonction order().

df_sorted_price_desc <- df[order(-df$selling_price), ]

dplyr

Vous pouvez utiliser la fonction desc() à l'intérieur de arrange() pour inverser l'ordre.

sorted_price_desc_dplyr <- df %>%
  arrange(desc(selling_price))

Tri par plusieurs colonnes

Il est possible de trier selon plusieurs colonnes afin de créer un ordre priorisé. Par exemple, il est possible de trier d'abord par type de carburant (ordre alphabétique), puis par prix de vente en ordre décroissant.

Base R

df_sorted <- df[order(df$fuel, -df$selling_price), ]

dplyr

df_sorted_dplyr <- df %>%
  arrange(fuel, desc(selling_price))
question mark

Que fait order(df$selling_price) ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 8
some-alt