Scorri per mostrare il menu

Sai già come selezionare singole righe e colonne utilizzando l'indicizzazione di base. Ora è il momento di fare un passo avanti ed esplorare come selezionare più righe e colonne utilizzando sia R base che il pacchetto dplyr. Queste tecniche sono fondamentali quando si desidera concentrarsi su parti specifiche di un dataset o preparare i dati per ulteriori analisi.

Selezione di più colonne

R base

È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c(). Il risultato è un data frame più piccolo che contiene solo le colonne specificate.

Utilizzando le posizioni delle colonne:

selected_data_base <- df[, c(1, 2, 3)]

Utilizzando i nomi delle colonne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

È possibile utilizzare la funzione select() e passare direttamente i nomi delle colonne.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indicizzazione di singoli valori

Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per verificare o eseguire il debug di singoli punti dati.

df[1, 2]  # accesses the value in row 1, column 2

Selezione di righe

A volte si desidera lavorare solo con le prime righe o con righe specifiche in base alla posizione.

Base R

È possibile selezionare più righe specificando il primo e l'ultimo indice e scrivendo un : tra di essi.

first_5_rows_base <- df[1:5, ]

dplyr

È possibile utilizzare la funzione slice() e passarle l'intervallo di righe che si desidera selezionare.

first_5_rows_dplyr <- df %>%
  slice(1:5)

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 5

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Selezione dei Dati - Tecniche Avanzate

Selezione di più colonne

R base

È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c(). Il risultato è un data frame più piccolo che contiene solo le colonne specificate.

Utilizzando le posizioni delle colonne:

selected_data_base <- df[, c(1, 2, 3)]

Utilizzando i nomi delle colonne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

È possibile utilizzare la funzione select() e passare direttamente i nomi delle colonne.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indicizzazione di singoli valori

Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per verificare o eseguire il debug di singoli punti dati.

df[1, 2]  # accesses the value in row 1, column 2

Selezione di righe

A volte si desidera lavorare solo con le prime righe o con righe specifiche in base alla posizione.

Base R

È possibile selezionare più righe specificando il primo e l'ultimo indice e scrivendo un : tra di essi.

first_5_rows_base <- df[1:5, ]

dplyr

È possibile utilizzare la funzione slice() e passarle l'intervallo di righe che si desidera selezionare.

first_5_rows_dplyr <- df %>%
  slice(1:5)

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 5