セクション 3. 章 6
single
チャレンジ:外れ値を中央値で置換
メニューを表示するにはスワイプしてください
外れ値は、特に誤りや通常のパターンを反映しない稀な事象から生じた場合、データ分析の品質に大きな影響を与える可能性があります。極端な値の影響を抑えつつ、すべてのデータポイントを保持したい場合、外れ値をその列の中央値で置き換える手法は堅牢です。中央値は外れ値の影響を受けにくいため、データ全体の分布を維持しながら安定した置換値を提供します。この方法は、行を削除してデータを失うことを避けたい場合や、平均値がまさに対処しようとしている外れ値によって歪められる場合に特に有効です。
123456789101112131415161718import pandas as pd # Example DataFrame with outliers in the 'score' column data = { "name": ["Alice", "Bob", "Charlie", "David", "Eve"], "score": [85, 90, 300, 88, 92] # 300 is an outlier } df = pd.DataFrame(data) # Let's say outliers have been identified using the IQR method # For this example, we know that 300 is an outlier outlier_mask = df["score"] > 150 print("Original DataFrame:") print(df) print("\nOutlier mask:") print(outlier_mask)
タスク
スワイプしてコーディングを開始
指定したDataFrameの列において、外れ値をその列の中央値で置き換える関数の作成。ブールマスクを用いて外れ値を特定し、該当する値を中央値で更新すること。関数はDataFrameをインプレースで更新し、指定列のすべての外れ値がその列の中央値に置き換えられるようにすること。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 3. 章 6
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください