Gruppering av numeriske data
Kontinuerlige numeriske data kan omgjøres til kategorier ved hjelp av funksjonen cut(). Dette er nyttig når du ønsker å analysere intervaller i stedet for enkeltverdier.
Funksjonsoversikt
Funksjonen cut() deler tall inn i intervaller og returnerer en faktor:
cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
x: numerisk vektor som skal kategoriseres;breaks: antall intervaller eller spesifikke delingspunkter;labels: navn på kategoriene;right: om intervallene skal være lukket til høyre;ordered_result: om kategoriene skal være ordnet.
Eksempel
12345678910heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
Som et resultat:
- Dataene deles inn i tre intervaller:
(0,160],(160,190]og(190,250]; - De er merket som
'short','medium'og'tall'; - Kategoriene følger en naturlig rekkefølge.
Swipe to start coding
Du har en vektor med numeriske karakterer. Slik kan du kategorisere dem som faktornivåer:
[0, 60)-'F';[60, 75)-'D';[75, 85)-'C';[85, 95)-'B';[95, 100)-'A'.
Din oppgave er å:
- Opprette en variabel kalt
grades_fsom kategoriserer karakterene ved å bruke funksjonencut(). Bruk følgende parametere:breaks-c(0, 60, 75, 85, 95, 100);labels-c('F', 'D', 'C', 'B', 'A');ordered_result-TRUE(for å ordne faktornivåene);right-FALSE(for å inkludere venstre grense av et intervall, ikke høyre).
- Skriv ut innholdet i
grades_f.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain what the `right` argument does in the `cut()` function?
How can I choose the best break points for my data?
What does the output of the `cut()` function look like?
Awesome!
Completion rate improved to 2.27
Gruppering av numeriske data
Sveip for å vise menyen
Kontinuerlige numeriske data kan omgjøres til kategorier ved hjelp av funksjonen cut(). Dette er nyttig når du ønsker å analysere intervaller i stedet for enkeltverdier.
Funksjonsoversikt
Funksjonen cut() deler tall inn i intervaller og returnerer en faktor:
cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
x: numerisk vektor som skal kategoriseres;breaks: antall intervaller eller spesifikke delingspunkter;labels: navn på kategoriene;right: om intervallene skal være lukket til høyre;ordered_result: om kategoriene skal være ordnet.
Eksempel
12345678910heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
Som et resultat:
- Dataene deles inn i tre intervaller:
(0,160],(160,190]og(190,250]; - De er merket som
'short','medium'og'tall'; - Kategoriene følger en naturlig rekkefølge.
Swipe to start coding
Du har en vektor med numeriske karakterer. Slik kan du kategorisere dem som faktornivåer:
[0, 60)-'F';[60, 75)-'D';[75, 85)-'C';[85, 95)-'B';[95, 100)-'A'.
Din oppgave er å:
- Opprette en variabel kalt
grades_fsom kategoriserer karakterene ved å bruke funksjonencut(). Bruk følgende parametere:breaks-c(0, 60, 75, 85, 95, 100);labels-c('F', 'D', 'C', 'B', 'A');ordered_result-TRUE(for å ordne faktornivåene);right-FALSE(for å inkludere venstre grense av et intervall, ikke høyre).
- Skriv ut innholdet i
grades_f.
Løsning
Takk for tilbakemeldingene dine!
single