Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Основні Контексти Select Проти With_Columns | Зміна парадигми, вибірка
Обробка Даних з Polars

Основні Контексти Select Проти With_Columns

Свайпніть щоб показати меню

Часто виникає потреба створювати нові стовпці або змінювати наявні у DataFrame Polars. Для цього використовуються два основних методи: select та with_columns. Кожен із них має своє призначення, і розуміння, коли який застосовувати, допоможе писати зрозумілий та ефективний код. Уявіть, що у вас є DataFrame games_df зі стовпцями positive_reviews, negative_reviews та total_reviews. Припустимо, потрібно обчислити відсоток позитивних відгуків для кожної гри. За допомогою select можна створити новий DataFrame лише з обчисленим стовпцем, а з with_columns — додати нові стовпці до наявного DataFrame.

У відеоуроці демонструється обидва підходи. Спочатку використовується select для створення DataFrame з новим стовпцем positive_pct, який обчислюється як positive_reviews / total_reviews:

1234567891011121314151617181920212223
import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)

Далі показано, як за допомогою with_columns можна додати новий стовпець, наприклад negative_pct, до наявного DataFrame. Цей стовпець обчислюється як negative_reviews / total_reviews:

12345
# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)

Зверніть увагу, що select повертає новий DataFrame лише з вказаними стовпцями, тоді як with_columns змінює існуючий DataFrame, додаючи або оновлюючи стовпці. Це розмежування важливе при виборі структури трансформацій даних. Щоб прояснити різницю між select та with_columns, розгляньте наступну порівняльну таблицю. Вона окреслює основні відмінності та містить короткий приклад для кожного методу.

Коли використовується select, створюється новий DataFrame, який містить лише вказані стовпці. Це корисно, коли потрібно зосередитися на підмножині стовпців або обчислених значеннях. На відміну від цього, with_columns ідеально підходить для додавання нових стовпців або оновлення існуючих у тому ж DataFrame, зберігаючи всі інші стовпці.

question mark

Яке твердження найкраще описує різницю між select та with_columns у Polars?

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 3

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 1. Розділ 3
some-alt