Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Selezione dei Dati - Tecniche Avanzate | Manipolazione e Pulizia dei Dati
Analisi dei Dati con R

bookSelezione dei Dati - Tecniche Avanzate

Sai già come selezionare singole righe e colonne utilizzando l'indicizzazione di base. Ora è il momento di fare un passo avanti ed esplorare come selezionare più righe e colonne utilizzando sia R base che il pacchetto dplyr. Queste tecniche sono fondamentali quando si desidera concentrarsi su parti specifiche di un dataset o preparare i dati per ulteriori analisi.

Selezione di più colonne

R base

È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c(). Il risultato è un data frame ridotto contenente solo le colonne specificate.

Utilizzo delle posizioni delle colonne:

selected_data_base <- df[, c(1, 2, 3)]

Utilizzo dei nomi delle colonne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

È possibile utilizzare la funzione select() e passare direttamente i nomi delle colonne.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indicizzazione di Singoli Valori

Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per la verifica o il debug di singoli punti dati.

df[1, 2]  # accesses the value in row 1, column 2

Slicing delle Righe

A volte si desidera lavorare solo con le prime righe o con righe specifiche in base alla posizione.

Base R

È possibile selezionare più righe specificando il primo e l'ultimo indice e scrivendo : tra di essi.

first_5_rows_base <- df[1:5, ]

dplyr

È possibile utilizzare la funzione slice() e passarle l'intervallo di righe che si desidera selezionare.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Cosa fa df[1:5, ]?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 5

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Awesome!

Completion rate improved to 4

bookSelezione dei Dati - Tecniche Avanzate

Scorri per mostrare il menu

Sai già come selezionare singole righe e colonne utilizzando l'indicizzazione di base. Ora è il momento di fare un passo avanti ed esplorare come selezionare più righe e colonne utilizzando sia R base che il pacchetto dplyr. Queste tecniche sono fondamentali quando si desidera concentrarsi su parti specifiche di un dataset o preparare i dati per ulteriori analisi.

Selezione di più colonne

R base

È possibile selezionare più colonne combinando le loro posizioni o i loro nomi con la funzione c(). Il risultato è un data frame ridotto contenente solo le colonne specificate.

Utilizzo delle posizioni delle colonne:

selected_data_base <- df[, c(1, 2, 3)]

Utilizzo dei nomi delle colonne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

È possibile utilizzare la funzione select() e passare direttamente i nomi delle colonne.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indicizzazione di Singoli Valori

Per accedere a un valore specifico, fornire sia il numero di riga che quello di colonna. Utile per la verifica o il debug di singoli punti dati.

df[1, 2]  # accesses the value in row 1, column 2

Slicing delle Righe

A volte si desidera lavorare solo con le prime righe o con righe specifiche in base alla posizione.

Base R

È possibile selezionare più righe specificando il primo e l'ultimo indice e scrivendo : tra di essi.

first_5_rows_base <- df[1:5, ]

dplyr

È possibile utilizzare la funzione slice() e passarle l'intervallo di righe che si desidera selezionare.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Cosa fa df[1:5, ]?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 5
some-alt