Tri des données
Le tri est une opération fondamentale en analyse de données. Il permet d’organiser un ensemble de données selon une ou plusieurs variables – telles que le prix, le kilométrage ou l’année. Cela facilite l’identification des tendances, des valeurs aberrantes, ou simplement la visualisation des données dans un ordre pertinent.
Tri par ordre croissant
Base R
Vous pouvez utiliser la fonction order()
pour trier un ensemble de données selon les valeurs d’une colonne. Par défaut, cela retourne les données par ordre croissant.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Le tri peut être effectué à l'aide de la fonction arrange()
, qui utilise également l'ordre croissant par défaut.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Tri par ordre décroissant
Base R
Pour trier par ordre décroissant, placer un signe négatif (-
) devant la colonne dans la fonction order()
.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Vous pouvez utiliser la fonction desc()
à l'intérieur de arrange()
pour inverser l'ordre.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Tri par plusieurs colonnes
Il est possible de trier selon plusieurs colonnes afin de créer un ordre prioritaire. Par exemple, il est possible de trier d'abord par type de carburant (ordre alphabétique), puis par prix de vente en ordre décroissant.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 4
Tri des données
Glissez pour afficher le menu
Le tri est une opération fondamentale en analyse de données. Il permet d’organiser un ensemble de données selon une ou plusieurs variables – telles que le prix, le kilométrage ou l’année. Cela facilite l’identification des tendances, des valeurs aberrantes, ou simplement la visualisation des données dans un ordre pertinent.
Tri par ordre croissant
Base R
Vous pouvez utiliser la fonction order()
pour trier un ensemble de données selon les valeurs d’une colonne. Par défaut, cela retourne les données par ordre croissant.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Le tri peut être effectué à l'aide de la fonction arrange()
, qui utilise également l'ordre croissant par défaut.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Tri par ordre décroissant
Base R
Pour trier par ordre décroissant, placer un signe négatif (-
) devant la colonne dans la fonction order()
.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Vous pouvez utiliser la fonction desc()
à l'intérieur de arrange()
pour inverser l'ordre.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Tri par plusieurs colonnes
Il est possible de trier selon plusieurs colonnes afin de créer un ordre prioritaire. Par exemple, il est possible de trier d'abord par type de carburant (ordre alphabétique), puis par prix de vente en ordre décroissant.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Merci pour vos commentaires !