Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Sortering av Data | Datamanipulering och Datarensning
Dataanalys med R

bookSortering av Data

Sortering är en grundläggande operation inom dataanalys. Det möjliggör organisering av datasetet baserat på en eller flera variabler – såsom pris, körsträcka eller år. Detta underlättar identifiering av trender, avvikare eller att helt enkelt visa data i en meningsfull ordning.

Sortering i stigande ordning

Base R

Funktionen order() kan användas för att sortera ett dataset efter kolumnvärden. Som standard returneras data i stigande ordning.

df_sorted_price_base <- df[order(df$selling_price), ]

dplyr

Sortering kan utföras med funktionen arrange(), som som standard sorterar i stigande ordning.

df_sorted_price_dplyr <- df %>%
  arrange(selling_price)

Sortering i fallande ordning

Base R

För att sortera i fallande ordning, placera ett minustecken (-) framför kolumnen i funktionen order().

df_sorted_price_desc <- df[order(-df$selling_price), ]

dplyr

Du kan använda funktionen desc() inuti arrange() för att vända ordningen.

sorted_price_desc_dplyr <- df %>%
  arrange(desc(selling_price))

Sortering efter flera kolumner

Det är möjligt att sortera efter mer än en kolumn för att skapa en prioriterad ordning. Till exempel kan du först sortera efter bränsletyp (alfabetiskt) och sedan efter försäljningspris i fallande ordning.

Base R

df_sorted <- df[order(df$fuel, -df$selling_price), ]

dplyr

df_sorted_dplyr <- df %>%
  arrange(fuel, desc(selling_price))
question mark

Vad gör order(df$selling_price)?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 8

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you explain the difference between sorting with base R and dplyr?

How do I sort by more than two columns?

What should I do if my column contains missing values when sorting?

Awesome!

Completion rate improved to 4

bookSortering av Data

Svep för att visa menyn

Sortering är en grundläggande operation inom dataanalys. Det möjliggör organisering av datasetet baserat på en eller flera variabler – såsom pris, körsträcka eller år. Detta underlättar identifiering av trender, avvikare eller att helt enkelt visa data i en meningsfull ordning.

Sortering i stigande ordning

Base R

Funktionen order() kan användas för att sortera ett dataset efter kolumnvärden. Som standard returneras data i stigande ordning.

df_sorted_price_base <- df[order(df$selling_price), ]

dplyr

Sortering kan utföras med funktionen arrange(), som som standard sorterar i stigande ordning.

df_sorted_price_dplyr <- df %>%
  arrange(selling_price)

Sortering i fallande ordning

Base R

För att sortera i fallande ordning, placera ett minustecken (-) framför kolumnen i funktionen order().

df_sorted_price_desc <- df[order(-df$selling_price), ]

dplyr

Du kan använda funktionen desc() inuti arrange() för att vända ordningen.

sorted_price_desc_dplyr <- df %>%
  arrange(desc(selling_price))

Sortering efter flera kolumner

Det är möjligt att sortera efter mer än en kolumn för att skapa en prioriterad ordning. Till exempel kan du först sortera efter bränsletyp (alfabetiskt) och sedan efter försäljningspris i fallande ordning.

Base R

df_sorted <- df[order(df$fuel, -df$selling_price), ]

dplyr

df_sorted_dplyr <- df %>%
  arrange(fuel, desc(selling_price))
question mark

Vad gör order(df$selling_price)?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 8
some-alt