Contenu du cours
Introduction à R : Partie I
Introduction à R : Partie I
Niveaux
Revisitons l'étiquette Levels
: vous la voyez souvent lorsque vous travaillez avec des sorties de facteurs. Que faire si vous souhaitez voir toutes les valeurs possibles qu'un facteur peut prendre ?
Pour afficher tous les niveaux d'un facteur, qui sont les valeurs catégoriques distinctes qu'il contient, utilisez la fonction levels()
avec la variable facteur comme argument. Voyons un exemple :
# Vector of currencies as factor curr_f <- factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR')) # Output all the levels levels(curr_f)
Il est intéressant de noter que vous pouvez réorganiser ces niveaux sans modifier les données réelles. Néanmoins, nous rencontrons parfois des variables de facteur ordonnées. Prenons la taille, par exemple : on peut être classé comme grand, moyen ou petit. Cet ordre implique grand > moyen > petit.
R permet cela en vous permettant de spécifier le paramètre ordered
comme TRUE
. Cela organise les variables alphabétiquement pour les valeurs textuelles ou numériquement pour les valeurs qui sont des nombres.
Bien que l'ordre numérique soit généralement simple et souhaité, l'ordre alphabétique peut ne pas être approprié. Pour établir un ordre spécifique, vous devez également définir le paramètre labels
sur un vecteur qui liste vos valeurs dans l'ordre croissant.
Voyons un exemple pour plus de clarté :
# Factors with no ordering factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR')) # Factors with ordering without labels parameter factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR'), ordered = T) # Factors with ordering with labels parameter factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR'), ordered = T, labels = c('USD', 'EUR', 'CHF', 'AUD', 'NOK'))
Observer la différence est instructif. Essayez-le vous-même !
Swipe to start coding
Disons que vous avez un vecteur de notes allant de 'A' à 'F'. Vous êtes chargé de le convertir en un facteur ordonné avec la séquence 'F < D < C < B < A' :
- Convertissez le vecteur
grades
en un facteur, en capturant l'ordre requis, et stockez-le dans la variablegrades_f
. - Affichez l'intégralité de la variable
grades_f
.
Solution
Merci pour vos commentaires !
Niveaux
Revisitons l'étiquette Levels
: vous la voyez souvent lorsque vous travaillez avec des sorties de facteurs. Que faire si vous souhaitez voir toutes les valeurs possibles qu'un facteur peut prendre ?
Pour afficher tous les niveaux d'un facteur, qui sont les valeurs catégoriques distinctes qu'il contient, utilisez la fonction levels()
avec la variable facteur comme argument. Voyons un exemple :
# Vector of currencies as factor curr_f <- factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR')) # Output all the levels levels(curr_f)
Il est intéressant de noter que vous pouvez réorganiser ces niveaux sans modifier les données réelles. Néanmoins, nous rencontrons parfois des variables de facteur ordonnées. Prenons la taille, par exemple : on peut être classé comme grand, moyen ou petit. Cet ordre implique grand > moyen > petit.
R permet cela en vous permettant de spécifier le paramètre ordered
comme TRUE
. Cela organise les variables alphabétiquement pour les valeurs textuelles ou numériquement pour les valeurs qui sont des nombres.
Bien que l'ordre numérique soit généralement simple et souhaité, l'ordre alphabétique peut ne pas être approprié. Pour établir un ordre spécifique, vous devez également définir le paramètre labels
sur un vecteur qui liste vos valeurs dans l'ordre croissant.
Voyons un exemple pour plus de clarté :
# Factors with no ordering factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR')) # Factors with ordering without labels parameter factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR'), ordered = T) # Factors with ordering with labels parameter factor(c('USD', 'EUR', 'AUD', 'NOK', 'CHF', 'EUR', 'AUD', 'EUR'), ordered = T, labels = c('USD', 'EUR', 'CHF', 'AUD', 'NOK'))
Observer la différence est instructif. Essayez-le vous-même !
Swipe to start coding
Disons que vous avez un vecteur de notes allant de 'A' à 'F'. Vous êtes chargé de le convertir en un facteur ordonné avec la séquence 'F < D < C < B < A' :
- Convertissez le vecteur
grades
en un facteur, en capturant l'ordre requis, et stockez-le dans la variablegrades_f
. - Affichez l'intégralité de la variable
grades_f
.
Solution
Merci pour vos commentaires !