Групування Числових Даних
Неперервні числові дані можна перетворити на категорії за допомогою функції cut()
. Це корисно, коли потрібно аналізувати діапазони, а не окремі значення.
Огляд функції
Функція cut()
розділяє числа на інтервали та повертає фактор:
cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
x
: числовий вектор для категоризації;breaks
: кількість інтервалів або конкретні точки поділу;labels
: назви категорій;right
: чи інтервали замкнені справа;ordered_result
: чи мають категорії бути впорядкованими.
Приклад
12345678910heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
У результаті:
- Дані поділено на три інтервали:
(0,160]
,(160,190]
та(190,250]
; - Вони позначені як
'short'
,'medium'
та'tall'
; - Категорії мають природний порядок.
Swipe to start coding
У вас є вектор числових оцінок. Ось як їх можна категоризувати за рівнями факторів:
[0, 60)
-'F'
;[60, 75)
-'D'
;[75, 85)
-'C'
;[85, 95)
-'B'
;[95, 100)
-'A'
.
Ваше завдання:
- Створити змінну
grades_f
, яка категоризує оцінки за допомогою функціїcut()
. Використайте такі параметри:breaks
-c(0, 60, 75, 85, 95, 100)
;labels
-c('F', 'D', 'C', 'B', 'A')
;ordered_result
-TRUE
(щоб упорядкувати значення фактора);right
-FALSE
(щоб включати ліву межу інтервалу, а не праву).
- Вивести вміст
grades_f
.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain what the `right` argument does in the `cut()` function?
How can I choose the best break points for my data?
What does the output of the `cut()` function look like?
Awesome!
Completion rate improved to 2.27
Групування Числових Даних
Свайпніть щоб показати меню
Неперервні числові дані можна перетворити на категорії за допомогою функції cut()
. Це корисно, коли потрібно аналізувати діапазони, а не окремі значення.
Огляд функції
Функція cut()
розділяє числа на інтервали та повертає фактор:
cut(x, breaks, labels = NULL, right = TRUE, ordered_result = FALSE)
x
: числовий вектор для категоризації;breaks
: кількість інтервалів або конкретні точки поділу;labels
: назви категорій;right
: чи інтервали замкнені справа;ordered_result
: чи мають категорії бути впорядкованими.
Приклад
12345678910heights <- c(170, 165, 195, 172, 189, 156, 178, 198, 157, 182, 171, 184, 163, 176, 169, 153) # Split heights into 3 groups heights_f <- cut(heights, breaks = c(0, 160, 190, 250), labels = c('short', 'medium', 'tall'), ordered_result = TRUE) heights_f
У результаті:
- Дані поділено на три інтервали:
(0,160]
,(160,190]
та(190,250]
; - Вони позначені як
'short'
,'medium'
та'tall'
; - Категорії мають природний порядок.
Swipe to start coding
У вас є вектор числових оцінок. Ось як їх можна категоризувати за рівнями факторів:
[0, 60)
-'F'
;[60, 75)
-'D'
;[75, 85)
-'C'
;[85, 95)
-'B'
;[95, 100)
-'A'
.
Ваше завдання:
- Створити змінну
grades_f
, яка категоризує оцінки за допомогою функціїcut()
. Використайте такі параметри:breaks
-c(0, 60, 75, 85, 95, 100)
;labels
-c('F', 'D', 'C', 'B', 'A')
;ordered_result
-TRUE
(щоб упорядкувати значення фактора);right
-FALSE
(щоб включати ліву межу інтервалу, а не праву).
- Вивести вміст
grades_f
.
Рішення
Дякуємо за ваш відгук!
single