Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Вибір Даних – Розширені Методи | Маніпулювання та Очищення Даних
Аналіз Даних у R

bookВибір Даних – Розширені Методи

Ви вже знаєте, як вибирати окремі рядки та стовпці за допомогою базового індексування. Тепер настав час перейти далі й розглянути, як вибирати кілька рядків і стовпців, використовуючи як базові можливості R, так і пакет dplyr. Ці техніки є необхідними, коли потрібно зосередитися на певних частинах набору даних або підготувати дані для подальшого аналізу.

Вибір кількох стовпців

Базовий R

Можна вибирати кілька стовпців, комбінуючи їхні позиції або назви за допомогою функції c(). Результатом буде менший датафрейм, що містить лише вказані стовпці.

Використання позицій стовпців:

selected_data_base <- df[, c(1, 2, 3)]

Використання назв стовпців:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Можна використовувати функцію select() та передавати імена стовпців безпосередньо.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Індексація окремих значень

Для доступу до конкретного значення вкажіть як номер рядка, так і номер стовпця. Це корисно при перевірці або налагодженні окремих даних.

df[1, 2]  # accesses the value in row 1, column 2

Вибірка рядків

Іноді потрібно працювати лише з першими кількома рядками або з певними рядками за позицією.

Base R

Можна вибрати декілька рядків, вказавши перший і останній індекс та написавши між ними :.

first_5_rows_base <- df[1:5, ]

dplyr

Можна використати функцію slice() та передати їй діапазон рядків, які потрібно взяти.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Що робить df[1:5, ]?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 5

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain the difference between selecting columns by position and by name in R?

How does the pipe operator improve code readability in dplyr?

Can you show how to select non-consecutive rows or columns using dplyr?

Awesome!

Completion rate improved to 4

bookВибір Даних – Розширені Методи

Свайпніть щоб показати меню

Ви вже знаєте, як вибирати окремі рядки та стовпці за допомогою базового індексування. Тепер настав час перейти далі й розглянути, як вибирати кілька рядків і стовпців, використовуючи як базові можливості R, так і пакет dplyr. Ці техніки є необхідними, коли потрібно зосередитися на певних частинах набору даних або підготувати дані для подальшого аналізу.

Вибір кількох стовпців

Базовий R

Можна вибирати кілька стовпців, комбінуючи їхні позиції або назви за допомогою функції c(). Результатом буде менший датафрейм, що містить лише вказані стовпці.

Використання позицій стовпців:

selected_data_base <- df[, c(1, 2, 3)]

Використання назв стовпців:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Можна використовувати функцію select() та передавати імена стовпців безпосередньо.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Індексація окремих значень

Для доступу до конкретного значення вкажіть як номер рядка, так і номер стовпця. Це корисно при перевірці або налагодженні окремих даних.

df[1, 2]  # accesses the value in row 1, column 2

Вибірка рядків

Іноді потрібно працювати лише з першими кількома рядками або з певними рядками за позицією.

Base R

Можна вибрати декілька рядків, вказавши перший і останній індекс та написавши між ними :.

first_5_rows_base <- df[1:5, ]

dplyr

Можна використати функцію slice() та передати їй діапазон рядків, які потрібно взяти.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Що робить df[1:5, ]?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 5
some-alt