Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Regroupement de Données Numériques | Facteurs
Introduction à R

bookRegroupement de Données Numériques

Les données numériques continues peuvent être transformées en catégories à l'aide de la fonction cut(). Ceci est utile lorsque l'analyse porte sur des plages de valeurs plutôt que sur des valeurs individuelles.

Présentation de la fonction

La fonction cut() divise les nombres en intervalles et retourne un facteur :

cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
  • x : vecteur numérique à catégoriser ;
  • breaks : nombre d'intervalles ou points de coupure spécifiques ;
  • labels : noms des catégories ;
  • right : indique si les intervalles sont fermés à droite ;
  • ordered_result : indique si les catégories doivent être ordonnées.

Exemple

12345678910
heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
copy

En conséquence :

  • Les données sont réparties en trois intervalles : (0,160], (160,190] et (190,250] ;
  • Ces intervalles sont étiquetés comme 'short', 'medium' et 'tall' ;
  • Les catégories suivent un ordre naturel.
Tâche

Swipe to start coding

Vous disposez d'un vecteur de notes numériques. Voici comment les catégoriser en niveaux de facteur :

  • [0, 60) - 'F' ;
  • [60, 75) - 'D' ;
  • [75, 85) - 'C' ;
  • [85, 95) - 'B' ;
  • [95, 100) - 'A'.

Votre tâche consiste à :

  1. Créer une variable appelée grades_f qui catégorise les notes à l'aide de la fonction cut(). Utilisez les paramètres suivants :
    • breaks - c(0, 60, 75, 85, 95, 100) ;
    • labels - c('F', 'D', 'C', 'B', 'A') ;
    • ordered_result - TRUE (pour ordonner les valeurs du facteur) ;
    • right - FALSE (pour inclure la borne gauche de l'intervalle, et non la droite).
  2. Afficher le contenu de grades_f.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 2.27

bookRegroupement de Données Numériques

Glissez pour afficher le menu

Les données numériques continues peuvent être transformées en catégories à l'aide de la fonction cut(). Ceci est utile lorsque l'analyse porte sur des plages de valeurs plutôt que sur des valeurs individuelles.

Présentation de la fonction

La fonction cut() divise les nombres en intervalles et retourne un facteur :

cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
  • x : vecteur numérique à catégoriser ;
  • breaks : nombre d'intervalles ou points de coupure spécifiques ;
  • labels : noms des catégories ;
  • right : indique si les intervalles sont fermés à droite ;
  • ordered_result : indique si les catégories doivent être ordonnées.

Exemple

12345678910
heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
copy

En conséquence :

  • Les données sont réparties en trois intervalles : (0,160], (160,190] et (190,250] ;
  • Ces intervalles sont étiquetés comme 'short', 'medium' et 'tall' ;
  • Les catégories suivent un ordre naturel.
Tâche

Swipe to start coding

Vous disposez d'un vecteur de notes numériques. Voici comment les catégoriser en niveaux de facteur :

  • [0, 60) - 'F' ;
  • [60, 75) - 'D' ;
  • [75, 85) - 'C' ;
  • [85, 95) - 'B' ;
  • [95, 100) - 'A'.

Votre tâche consiste à :

  1. Créer une variable appelée grades_f qui catégorise les notes à l'aide de la fonction cut(). Utilisez les paramètres suivants :
    • breaks - c(0, 60, 75, 85, 95, 100) ;
    • labels - c('F', 'D', 'C', 'B', 'A') ;
    • ordered_result - TRUE (pour ordonner les valeurs du facteur) ;
    • right - FALSE (pour inclure la borne gauche de l'intervalle, et non la droite).
  2. Afficher le contenu de grades_f.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5
single

single

some-alt