Contenu du cours
Introduction à R : Partie I
Introduction à R : Partie I
Regroupement des Données Numériques
Pour catégoriser les données numériques en groupes, vous pouvez utiliser la fonction cut()
en R, qui attribue chaque nombre à une catégorie basée sur des intervalles spécifiés. Par exemple, si vous avez une variable continue comme la taille, vous pouvez catégoriser les individus comme 'grand', 'moyen' ou 'petit' en fonction des plages de taille.
Voici comment vous pouvez l'utiliser :
Parmi les paramètres listés, ceux-ci sont cruciaux pour catégoriser les données :
x
est le vecteur numérique à catégoriser ;breaks
peut être un entier spécifiant le nombre d'intervalles ou un vecteur de points de coupure ;labels
fournissent des noms pour les catégories ;right
indique si les intervalles doivent être fermés à droite ;ordered_result
détermine si les facteurs résultants doivent avoir un ordre.
Pour créer trois catégories, définissez breaks
à 3
ou fournissez un vecteur avec quatre points de coupure pour former trois intervalles, par exemple (a,b], (b,c], (c,d].
# Vector of heights heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Convert into factor by cutting into intervals heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('small', 'medium', 'tall'), ordered_result = T) heights_f # Output the factor variable
Pour notre exemple de catégorisation de la taille, nous choisissons c(0, 160, 190, 250)
pour breaks
afin de diviser les données en trois groupes : (0, 160], (160, 190], et (190, 250]. Nous définissons également ordered_result
à TRUE
pour définir un ordre logique parmi les catégories (par exemple, petit < moyen < grand).
Swipe to start coding
-
Étant donné un vecteur de notes numériques, voici comment les catégoriser en niveaux de facteur :
- [0, 60) - F ;
- [60, 75) - D ;
- [75, 85) - C ;
- [85, 95) - B ;
- [95, 100) - A.
-
Créez une variable
grades_f
qui stocke les niveaux de facteur avec les coupures et étiquettes spécifiées, en tenant compte de l'ordre, et utilisezright = FALSE
pour inclure la limite gauche des intervalles ;breaks
-c(0, 60, 75, 85, 95, 100)
;labels
-c('F', 'D', 'C', 'B', 'A')
;ordered_result
-TRUE
(pour ordonner les valeurs du facteur);right
-FALSE
(pour inclure la limite gauche d'un intervalle, pas la droite).
-
Affichez le contenu de
grades_f
.
Solution
Merci pour vos commentaires !
Regroupement des Données Numériques
Pour catégoriser les données numériques en groupes, vous pouvez utiliser la fonction cut()
en R, qui attribue chaque nombre à une catégorie basée sur des intervalles spécifiés. Par exemple, si vous avez une variable continue comme la taille, vous pouvez catégoriser les individus comme 'grand', 'moyen' ou 'petit' en fonction des plages de taille.
Voici comment vous pouvez l'utiliser :
Parmi les paramètres listés, ceux-ci sont cruciaux pour catégoriser les données :
x
est le vecteur numérique à catégoriser ;breaks
peut être un entier spécifiant le nombre d'intervalles ou un vecteur de points de coupure ;labels
fournissent des noms pour les catégories ;right
indique si les intervalles doivent être fermés à droite ;ordered_result
détermine si les facteurs résultants doivent avoir un ordre.
Pour créer trois catégories, définissez breaks
à 3
ou fournissez un vecteur avec quatre points de coupure pour former trois intervalles, par exemple (a,b], (b,c], (c,d].
# Vector of heights heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Convert into factor by cutting into intervals heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('small', 'medium', 'tall'), ordered_result = T) heights_f # Output the factor variable
Pour notre exemple de catégorisation de la taille, nous choisissons c(0, 160, 190, 250)
pour breaks
afin de diviser les données en trois groupes : (0, 160], (160, 190], et (190, 250]. Nous définissons également ordered_result
à TRUE
pour définir un ordre logique parmi les catégories (par exemple, petit < moyen < grand).
Swipe to start coding
-
Étant donné un vecteur de notes numériques, voici comment les catégoriser en niveaux de facteur :
- [0, 60) - F ;
- [60, 75) - D ;
- [75, 85) - C ;
- [85, 95) - B ;
- [95, 100) - A.
-
Créez une variable
grades_f
qui stocke les niveaux de facteur avec les coupures et étiquettes spécifiées, en tenant compte de l'ordre, et utilisezright = FALSE
pour inclure la limite gauche des intervalles ;breaks
-c(0, 60, 75, 85, 95, 100)
;labels
-c('F', 'D', 'C', 'B', 'A')
;ordered_result
-TRUE
(pour ordonner les valeurs du facteur);right
-FALSE
(pour inclure la limite gauche d'un intervalle, pas la droite).
-
Affichez le contenu de
grades_f
.
Solution
Merci pour vos commentaires !