Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Selezione dei Dati - Tecniche Avanzate | Manipolazione e Pulizia dei Dati
Analisi dei Dati con R

bookSelezione dei Dati - Tecniche Avanzate

Hai già appreso come selezionare singole righe e colonne utilizzando l'indicizzazione di base. Ora è il momento di fare un passo avanti ed esplorare come selezionare più righe e colonne utilizzando sia R base che il pacchetto dplyr. Queste tecniche sono fondamentali quando si desidera concentrarsi su parti specifiche di un dataset o preparare i dati per ulteriori analisi.

Selezione di più colonne

R base

È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c(). Il risultato è un data frame ridotto che contiene solo le colonne specificate.

Utilizzo delle posizioni delle colonne:

selected_data_base <- df[, c(1, 2, 3)]

Utilizzo dei nomi delle colonne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

È possibile utilizzare la funzione select() e passare direttamente i nomi delle colonne.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indicizzazione di singoli valori

Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per la verifica o il debug di singoli dati.

df[1, 2]  # accesses the value in row 1, column 2

Suddivisione delle righe

A volte è necessario lavorare solo con le prime righe o con righe specifiche in base alla posizione.

Base R

È possibile selezionare più righe specificando l'indice della prima e dell'ultima riga, separati da :.

first_5_rows_base <- df[1:5, ]

dplyr

È possibile utilizzare la funzione slice() e passarle l'intervallo di righe desiderato.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Cosa fa df[1:5, ]?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 5

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain the difference between selecting columns by position and by name in R?

How does the pipe operator improve code readability in dplyr?

Can you show how to select non-consecutive rows or columns using dplyr?

Awesome!

Completion rate improved to 4

bookSelezione dei Dati - Tecniche Avanzate

Scorri per mostrare il menu

Hai già appreso come selezionare singole righe e colonne utilizzando l'indicizzazione di base. Ora è il momento di fare un passo avanti ed esplorare come selezionare più righe e colonne utilizzando sia R base che il pacchetto dplyr. Queste tecniche sono fondamentali quando si desidera concentrarsi su parti specifiche di un dataset o preparare i dati per ulteriori analisi.

Selezione di più colonne

R base

È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c(). Il risultato è un data frame ridotto che contiene solo le colonne specificate.

Utilizzo delle posizioni delle colonne:

selected_data_base <- df[, c(1, 2, 3)]

Utilizzo dei nomi delle colonne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

È possibile utilizzare la funzione select() e passare direttamente i nomi delle colonne.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indicizzazione di singoli valori

Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per la verifica o il debug di singoli dati.

df[1, 2]  # accesses the value in row 1, column 2

Suddivisione delle righe

A volte è necessario lavorare solo con le prime righe o con righe specifiche in base alla posizione.

Base R

È possibile selezionare più righe specificando l'indice della prima e dell'ultima riga, separati da :.

first_5_rows_base <- df[1:5, ]

dplyr

È possibile utilizzare la funzione slice() e passarle l'intervallo di righe desiderato.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Cosa fa df[1:5, ]?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 5
some-alt