Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Regroupement des Données Numériques | Facteurs
Introduction à R : Partie I
course content

Contenu du cours

Introduction à R : Partie I

Introduction à R : Partie I

1. Syntaxe de Base et Opérations
2. Types de Données de Base et Vecteurs
3. Facteurs

book
Regroupement des Données Numériques

Pour catégoriser les données numériques en groupes, vous pouvez utiliser la fonction cut() en R, qui attribue chaque nombre à une catégorie basée sur des intervalles spécifiés. Par exemple, si vous avez une variable continue comme la taille, vous pouvez catégoriser les individus comme 'grand', 'moyen' ou 'petit' en fonction des plages de taille.

Voici comment vous pouvez l'utiliser :

Parmi les paramètres listés, ceux-ci sont cruciaux pour catégoriser les données :

  • x est le vecteur numérique à catégoriser ;
  • breaks peut être un entier spécifiant le nombre d'intervalles ou un vecteur de points de coupure ;
  • labels fournissent des noms pour les catégories ;
  • right indique si les intervalles doivent être fermés à droite ;
  • ordered_result détermine si les facteurs résultants doivent avoir un ordre.

Pour créer trois catégories, définissez breaks à 3 ou fournissez un vecteur avec quatre points de coupure pour former trois intervalles, par exemple (a,b], (b,c], (c,d].

1234567
# Vector of heights heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Convert into factor by cutting into intervals heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('small', 'medium', 'tall'), ordered_result = T) heights_f # Output the factor variable
copy

Pour notre exemple de catégorisation de la taille, nous choisissons c(0, 160, 190, 250) pour breaks afin de diviser les données en trois groupes : (0, 160], (160, 190], et (190, 250]. Nous définissons également ordered_result à TRUE pour définir un ordre logique parmi les catégories (par exemple, petit < moyen < grand).

Tâche

Swipe to start coding

  1. Étant donné un vecteur de notes numériques, voici comment les catégoriser en niveaux de facteur :

    • [0, 60) - F ;
    • [60, 75) - D ;
    • [75, 85) - C ;
    • [85, 95) - B ;
    • [95, 100) - A.
  2. Créez une variable grades_f qui stocke les niveaux de facteur avec les coupures et étiquettes spécifiées, en tenant compte de l'ordre, et utilisez right = FALSE pour inclure la limite gauche des intervalles ;

    • breaks - c(0, 60, 75, 85, 95, 100) ;
    • labels - c('F', 'D', 'C', 'B', 'A') ;
    • ordered_result - TRUE (pour ordonner les valeurs du facteur);
    • right - FALSE (pour inclure la limite gauche d'un intervalle, pas la droite).
  3. Affichez le contenu de grades_f.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5
toggle bottom row

book
Regroupement des Données Numériques

Pour catégoriser les données numériques en groupes, vous pouvez utiliser la fonction cut() en R, qui attribue chaque nombre à une catégorie basée sur des intervalles spécifiés. Par exemple, si vous avez une variable continue comme la taille, vous pouvez catégoriser les individus comme 'grand', 'moyen' ou 'petit' en fonction des plages de taille.

Voici comment vous pouvez l'utiliser :

Parmi les paramètres listés, ceux-ci sont cruciaux pour catégoriser les données :

  • x est le vecteur numérique à catégoriser ;
  • breaks peut être un entier spécifiant le nombre d'intervalles ou un vecteur de points de coupure ;
  • labels fournissent des noms pour les catégories ;
  • right indique si les intervalles doivent être fermés à droite ;
  • ordered_result détermine si les facteurs résultants doivent avoir un ordre.

Pour créer trois catégories, définissez breaks à 3 ou fournissez un vecteur avec quatre points de coupure pour former trois intervalles, par exemple (a,b], (b,c], (c,d].

1234567
# Vector of heights heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Convert into factor by cutting into intervals heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('small', 'medium', 'tall'), ordered_result = T) heights_f # Output the factor variable
copy

Pour notre exemple de catégorisation de la taille, nous choisissons c(0, 160, 190, 250) pour breaks afin de diviser les données en trois groupes : (0, 160], (160, 190], et (190, 250]. Nous définissons également ordered_result à TRUE pour définir un ordre logique parmi les catégories (par exemple, petit < moyen < grand).

Tâche

Swipe to start coding

  1. Étant donné un vecteur de notes numériques, voici comment les catégoriser en niveaux de facteur :

    • [0, 60) - F ;
    • [60, 75) - D ;
    • [75, 85) - C ;
    • [85, 95) - B ;
    • [95, 100) - A.
  2. Créez une variable grades_f qui stocke les niveaux de facteur avec les coupures et étiquettes spécifiées, en tenant compte de l'ordre, et utilisez right = FALSE pour inclure la limite gauche des intervalles ;

    • breaks - c(0, 60, 75, 85, 95, 100) ;
    • labels - c('F', 'D', 'C', 'B', 'A') ;
    • ordered_result - TRUE (pour ordonner les valeurs du facteur);
    • right - FALSE (pour inclure la limite gauche d'un intervalle, pas la droite).
  3. Affichez le contenu de grades_f.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5
Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
We're sorry to hear that something went wrong. What happened?
some-alt