Numeerisen Datan Ryhmittely
Jatkuva numeerinen data voidaan muuntaa kategorioiksi käyttämällä cut()-funktiota. Tämä on hyödyllistä, kun halutaan analysoida arvoalueita yksittäisten arvojen sijaan.
Funktion yleiskuvaus
cut()-funktio jakaa luvut väleihin ja palauttaa faktorimuuttujan:
cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
x: numeerinen vektori, joka halutaan kategorisoida;breaks: intervallien määrä tai tietyt jakopisteet;labels: kategorioiden nimet;right: ovatko välit oikealta suljettuja;ordered_result: tulisiko kategorioiden olla järjestettyjä.
Esimerkki
12345678910heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
Tuloksena:
- Data jaetaan kolmeen väliin:
(0,160],(160,190]ja(190,250]; - Ne nimetään
'short','medium'ja'tall'; - Luokat ovat luonnollisessa järjestyksessä.
Swipe to start coding
Sinulla on vektori numeerisia arvosanoja. Näin voit luokitella ne faktoritason arvoihin:
[0, 60)-'F';[60, 75)-'D';[75, 85)-'C';[85, 95)-'B';[95, 100)-'A'.
Tehtäväsi on:
- Luo muuttuja nimeltä
grades_f, joka luokittelee arvosanat käyttäencut()-funktiota. Käytä seuraavia parametreja:breaks-c(0, 60, 75, 85, 95, 100);labels-c('F', 'D', 'C', 'B', 'A');ordered_result-TRUE(jotta faktoritasot ovat järjestyksessä);right-FALSE(jotta välin vasen raja sisällytetään, ei oikea).
- Tulosta
grades_f-muuttujan sisältö.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain what the `right` argument does in the `cut()` function?
How can I choose the best break points for my data?
What does the output of the `cut()` function look like?
Awesome!
Completion rate improved to 2.27
Numeerisen Datan Ryhmittely
Pyyhkäise näyttääksesi valikon
Jatkuva numeerinen data voidaan muuntaa kategorioiksi käyttämällä cut()-funktiota. Tämä on hyödyllistä, kun halutaan analysoida arvoalueita yksittäisten arvojen sijaan.
Funktion yleiskuvaus
cut()-funktio jakaa luvut väleihin ja palauttaa faktorimuuttujan:
cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
x: numeerinen vektori, joka halutaan kategorisoida;breaks: intervallien määrä tai tietyt jakopisteet;labels: kategorioiden nimet;right: ovatko välit oikealta suljettuja;ordered_result: tulisiko kategorioiden olla järjestettyjä.
Esimerkki
12345678910heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
Tuloksena:
- Data jaetaan kolmeen väliin:
(0,160],(160,190]ja(190,250]; - Ne nimetään
'short','medium'ja'tall'; - Luokat ovat luonnollisessa järjestyksessä.
Swipe to start coding
Sinulla on vektori numeerisia arvosanoja. Näin voit luokitella ne faktoritason arvoihin:
[0, 60)-'F';[60, 75)-'D';[75, 85)-'C';[85, 95)-'B';[95, 100)-'A'.
Tehtäväsi on:
- Luo muuttuja nimeltä
grades_f, joka luokittelee arvosanat käyttäencut()-funktiota. Käytä seuraavia parametreja:breaks-c(0, 60, 75, 85, 95, 100);labels-c('F', 'D', 'C', 'B', 'A');ordered_result-TRUE(jotta faktoritasot ovat järjestyksessä);right-FALSE(jotta välin vasen raja sisällytetään, ei oikea).
- Tulosta
grades_f-muuttujan sisältö.
Ratkaisu
Kiitos palautteestasi!
single