Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Sélection de Données - Techniques Avancées | Manipulation et Nettoyage des Données
Analyse de Données avec R

bookSélection de Données - Techniques Avancées

Vous savez déjà comment sélectionner des lignes et des colonnes individuelles à l'aide de l'indexation de base. Il est maintenant temps d'aller plus loin et d'explorer comment sélectionner plusieurs lignes et colonnes en utilisant à la fois le R de base et le package dplyr. Ces techniques sont essentielles lorsque vous souhaitez vous concentrer sur des parties spécifiques d'un jeu de données ou préparer vos données pour une analyse ultérieure.

Sélection de plusieurs colonnes

R de base

Vous pouvez sélectionner plusieurs colonnes en combinant leurs positions ou leurs noms avec la fonction c(). Le résultat est un data frame réduit contenant uniquement les colonnes spécifiées.

Utilisation des positions de colonnes :

selected_data_base <- df[, c(1, 2, 3)]

Utilisation des noms de colonnes :

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Vous pouvez utiliser la fonction select() et passer directement les noms des colonnes.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexation de valeurs uniques

Pour accéder à une valeur spécifique, indiquez à la fois les numéros de ligne et de colonne. Ceci est utile pour vérifier ou déboguer des points de données individuels.

df[1, 2]  # accesses the value in row 1, column 2

Découpage des lignes

Il arrive que vous souhaitiez uniquement travailler avec les premières lignes, ou des lignes spécifiques par position.

Base R

Vous pouvez sélectionner plusieurs lignes en spécifiant l’indice de la première et de la dernière ligne, séparés par un :.

first_5_rows_base <- df[1:5, ]

dplyr

Vous pouvez utiliser la fonction slice() et lui passer la plage de lignes souhaitée.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Que fait df[1:5, ] ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 5

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4

bookSélection de Données - Techniques Avancées

Glissez pour afficher le menu

Vous savez déjà comment sélectionner des lignes et des colonnes individuelles à l'aide de l'indexation de base. Il est maintenant temps d'aller plus loin et d'explorer comment sélectionner plusieurs lignes et colonnes en utilisant à la fois le R de base et le package dplyr. Ces techniques sont essentielles lorsque vous souhaitez vous concentrer sur des parties spécifiques d'un jeu de données ou préparer vos données pour une analyse ultérieure.

Sélection de plusieurs colonnes

R de base

Vous pouvez sélectionner plusieurs colonnes en combinant leurs positions ou leurs noms avec la fonction c(). Le résultat est un data frame réduit contenant uniquement les colonnes spécifiées.

Utilisation des positions de colonnes :

selected_data_base <- df[, c(1, 2, 3)]

Utilisation des noms de colonnes :

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Vous pouvez utiliser la fonction select() et passer directement les noms des colonnes.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexation de valeurs uniques

Pour accéder à une valeur spécifique, indiquez à la fois les numéros de ligne et de colonne. Ceci est utile pour vérifier ou déboguer des points de données individuels.

df[1, 2]  # accesses the value in row 1, column 2

Découpage des lignes

Il arrive que vous souhaitiez uniquement travailler avec les premières lignes, ou des lignes spécifiques par position.

Base R

Vous pouvez sélectionner plusieurs lignes en spécifiant l’indice de la première et de la dernière ligne, séparés par un :.

first_5_rows_base <- df[1:5, ]

dplyr

Vous pouvez utiliser la fonction slice() et lui passer la plage de lignes souhaitée.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Que fait df[1:5, ] ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 5
some-alt