Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ チャレンジ:平均値で欠損値を補完する | 欠損データおよび重複データの処理
Pythonによるデータクリーニング
セクション 2.  3
single

single

bookチャレンジ:平均値で欠損値を補完する

メニューを表示するにはスワイプしてください

平均値補完は、数値データの欠損値を処理するためのシンプルな手法。各列の欠損値を、その列の非欠損値の平均値で置き換える方法。データがランダムに欠損しており、値の分布が大きく偏っていない場合に最も適している。ただし、平均値補完はデータの分散や関係性を歪める可能性があり、特に多くの値が欠損している場合や、データが正規分布していない場合に注意が必要。これらの制限を考慮した上で、データクリーニングのワークフローに平均値補完を選択することが重要。

123456789
import pandas as pd import numpy as np data = { "id": [1, 2, 3, 4, 5], "score": [85, np.nan, 78, np.nan, 92] } df = pd.DataFrame(data) print(df)
copy
タスク

スワイプしてコーディングを開始

指定した数値列の欠損値を、その列の平均値で埋める関数を作成してください。この関数は、指定した列のすべての欠損値が非欠損値の平均で置き換えられた修正済みのDataFrameを返す必要があります。

解答

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 2.  3
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt