Sélection de Données - Notions de Base
Une fois votre jeu de données chargé dans R, il est nécessaire d'apprendre à travailler avec des parties spécifiques de celui-ci. Cela implique de sélectionner des lignes et des colonnes particulières sur lesquelles se concentrer. Que ce soit pour nettoyer les données ou analyser des tendances spécifiques, la capacité à sous-échantillonner efficacement vos données est essentielle.
Chargement de votre jeu de données
Avant de travailler avec des données, il est nécessaire de les charger et de les visualiser :
library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv") # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer
Sélection des lignes
Dans R, il est possible de sélectionner des lignes par leur position numérique. Comme l'indexation commence à 1, écrire df[3, ]
renverra la troisième ligne du jeu de données.
df[3, ]
Sélection d'une colonne par position
De la même manière que pour les lignes, il est possible de sélectionner une colonne en utilisant sa position numérique. En laissant l'indice de ligne vide et en spécifiant l'indice de colonne, df[, 5]
renvoie la cinquième colonne du jeu de données.
df[, 5]
Sélection d'une colonne par nom
Il est également possible d'accéder directement à une colonne par son nom en utilisant l'opérateur $
. Cela offre un moyen rapide et lisible d'extraire une seule colonne. Par exemple, df$km_driven
sélectionne la colonne nommée km_driven.
view(df$km_driven)
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain the difference between selecting rows and columns in R?
How do I select multiple rows or columns at once?
What is the advantage of using dplyr over base R for data selection?
Awesome!
Completion rate improved to 4
Sélection de Données - Notions de Base
Glissez pour afficher le menu
Une fois votre jeu de données chargé dans R, il est nécessaire d'apprendre à travailler avec des parties spécifiques de celui-ci. Cela implique de sélectionner des lignes et des colonnes particulières sur lesquelles se concentrer. Que ce soit pour nettoyer les données ou analyser des tendances spécifiques, la capacité à sous-échantillonner efficacement vos données est essentielle.
Chargement de votre jeu de données
Avant de travailler avec des données, il est nécessaire de les charger et de les visualiser :
library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv") # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer
Sélection des lignes
Dans R, il est possible de sélectionner des lignes par leur position numérique. Comme l'indexation commence à 1, écrire df[3, ]
renverra la troisième ligne du jeu de données.
df[3, ]
Sélection d'une colonne par position
De la même manière que pour les lignes, il est possible de sélectionner une colonne en utilisant sa position numérique. En laissant l'indice de ligne vide et en spécifiant l'indice de colonne, df[, 5]
renvoie la cinquième colonne du jeu de données.
df[, 5]
Sélection d'une colonne par nom
Il est également possible d'accéder directement à une colonne par son nom en utilisant l'opérateur $
. Cela offre un moyen rapide et lisible d'extraire une seule colonne. Par exemple, df$km_driven
sélectionne la colonne nommée km_driven.
view(df$km_driven)
Merci pour vos commentaires !