Tri des données
Le tri est une opération fondamentale en analyse de données. Il permet d'organiser votre jeu de données en fonction d'une ou plusieurs variables - telles que le prix, le kilométrage ou l'année. Cela facilite l'identification des tendances, des valeurs aberrantes, ou tout simplement la visualisation des données dans un ordre pertinent.
Tri par ordre croissant
Base R
La fonction order()
permet de trier un jeu de données selon les valeurs d'une colonne. Par défaut, elle retourne les données par ordre croissant.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Le tri peut être effectué à l'aide de la fonction arrange()
, qui utilise également l'ordre croissant par défaut.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Tri par ordre décroissant
Base R
Pour trier par ordre décroissant, placer un signe négatif (-
) devant la colonne à l'intérieur de la fonction order()
.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Vous pouvez utiliser la fonction desc()
à l'intérieur de arrange()
pour inverser l'ordre.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Tri par plusieurs colonnes
Il est possible de trier selon plusieurs colonnes afin de créer un ordre priorisé. Par exemple, il est possible de trier d'abord par type de carburant (ordre alphabétique), puis par prix de vente en ordre décroissant.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 4
Tri des données
Glissez pour afficher le menu
Le tri est une opération fondamentale en analyse de données. Il permet d'organiser votre jeu de données en fonction d'une ou plusieurs variables - telles que le prix, le kilométrage ou l'année. Cela facilite l'identification des tendances, des valeurs aberrantes, ou tout simplement la visualisation des données dans un ordre pertinent.
Tri par ordre croissant
Base R
La fonction order()
permet de trier un jeu de données selon les valeurs d'une colonne. Par défaut, elle retourne les données par ordre croissant.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Le tri peut être effectué à l'aide de la fonction arrange()
, qui utilise également l'ordre croissant par défaut.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Tri par ordre décroissant
Base R
Pour trier par ordre décroissant, placer un signe négatif (-
) devant la colonne à l'intérieur de la fonction order()
.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Vous pouvez utiliser la fonction desc()
à l'intérieur de arrange()
pour inverser l'ordre.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Tri par plusieurs colonnes
Il est possible de trier selon plusieurs colonnes afin de créer un ordre priorisé. Par exemple, il est possible de trier d'abord par type de carburant (ordre alphabétique), puis par prix de vente en ordre décroissant.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Merci pour vos commentaires !