Selezione dei Dati - Tecniche Avanzate
Sai già come selezionare singole righe e colonne utilizzando l'indicizzazione di base. Ora è il momento di fare un passo avanti ed esplorare come selezionare più righe e colonne utilizzando sia R base che il pacchetto dplyr
. Queste tecniche sono fondamentali quando si desidera concentrarsi su parti specifiche di un dataset o preparare i dati per ulteriori analisi.
Selezione di più colonne
R base
È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c()
. Il risultato è un data frame ridotto contenente solo le colonne specificate.
Utilizzo delle posizioni delle colonne:
selected_data_base <- df[, c(1, 2, 3)]
Utilizzo dei nomi delle colonne:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
È possibile utilizzare la funzione select()
e passare direttamente i nomi delle colonne.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indicizzazione di Singoli Valori
Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per la verifica o il debug di singoli punti dati.
df[1, 2] # accesses the value in row 1, column 2
Slicing delle Righe
A volte si desidera lavorare solo con le prime righe o con righe specifiche in base alla posizione.
Base R
È possibile selezionare più righe specificando il primo e l'ultimo indice e scrivendo :
tra di essi.
first_5_rows_base <- df[1:5, ]
dplyr
È possibile utilizzare la funzione slice()
e passarle l'intervallo di righe che si desidera selezionare.
first_5_rows_dplyr <- df %>%
slice(1:5)
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 4
Selezione dei Dati - Tecniche Avanzate
Scorri per mostrare il menu
Sai già come selezionare singole righe e colonne utilizzando l'indicizzazione di base. Ora è il momento di fare un passo avanti ed esplorare come selezionare più righe e colonne utilizzando sia R base che il pacchetto dplyr
. Queste tecniche sono fondamentali quando si desidera concentrarsi su parti specifiche di un dataset o preparare i dati per ulteriori analisi.
Selezione di più colonne
R base
È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c()
. Il risultato è un data frame ridotto contenente solo le colonne specificate.
Utilizzo delle posizioni delle colonne:
selected_data_base <- df[, c(1, 2, 3)]
Utilizzo dei nomi delle colonne:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
È possibile utilizzare la funzione select()
e passare direttamente i nomi delle colonne.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indicizzazione di Singoli Valori
Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per la verifica o il debug di singoli punti dati.
df[1, 2] # accesses the value in row 1, column 2
Slicing delle Righe
A volte si desidera lavorare solo con le prime righe o con righe specifiche in base alla posizione.
Base R
È possibile selezionare più righe specificando il primo e l'ultimo indice e scrivendo :
tra di essi.
first_5_rows_base <- df[1:5, ]
dplyr
È possibile utilizzare la funzione slice()
e passarle l'intervallo di righe che si desidera selezionare.
first_5_rows_dplyr <- df %>%
slice(1:5)
Grazie per i tuoi commenti!