Основні Контексти Select Проти With_Columns
Свайпніть щоб показати меню
Часто виникає потреба створювати нові стовпці або змінювати наявні у DataFrame Polars. Для цього використовуються два основних методи: select та with_columns. Кожен із них має своє призначення, і розуміння, коли який застосовувати, допоможе писати зрозумілий та ефективний код. Уявіть, що у вас є DataFrame games_df зі стовпцями positive_reviews, negative_reviews та total_reviews. Припустимо, потрібно обчислити відсоток позитивних відгуків для кожної гри. За допомогою select можна створити новий DataFrame лише з обчисленим стовпцем, а з with_columns — додати нові стовпці до наявного DataFrame.
У відеоуроці демонструється обидва підходи. Спочатку використовується select для створення DataFrame з новим стовпцем positive_pct, який обчислюється як positive_reviews / total_reviews:
1234567891011121314151617181920212223import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)
Далі показано, як за допомогою with_columns можна додати новий стовпець, наприклад negative_pct, до наявного DataFrame. Цей стовпець обчислюється як negative_reviews / total_reviews:
12345# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)
Зверніть увагу, що select повертає новий DataFrame лише з вказаними стовпцями, тоді як with_columns змінює існуючий DataFrame, додаючи або оновлюючи стовпці. Це розмежування важливе при виборі структури трансформацій даних.
Щоб прояснити різницю між select та with_columns, розгляньте наступну порівняльну таблицю. Вона окреслює основні відмінності та містить короткий приклад для кожного методу.
Коли використовується select, створюється новий DataFrame, який містить лише вказані стовпці. Це корисно, коли потрібно зосередитися на підмножині стовпців або обчислених значеннях. На відміну від цього, with_columns ідеально підходить для додавання нових стовпців або оновлення існуючих у тому ж DataFrame, зберігаючи всі інші стовпці.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат