セクション 2. 章 4
single
チャレンジ:欠損データを含む行の削除
メニューを表示するにはスワイプしてください
実際のデータセットを扱う際、NaN(非数値)として表される欠損値に頻繁に遭遇します。どのタイミングで欠損データを含む行を削除するかは、状況や欠損情報の重要性によって異なります。データセットが十分に大きく、一部の行を削除しても分析に大きな影響を与えない場合や、欠損データがランダムに散在しており体系的な問題を示していない場合には、行の削除が適切です。しかし、この方法は特定のグループに欠損値が集中している場合や、データセットが小さい場合には貴重な情報の損失につながる可能性があります。行を削除することでバイアスが生じたり、データの代表性が損なわれたりしないか常に検討してください。
1234567891011import pandas as pd import numpy as np data = { "name": ["Alice", "Bob", "Charlie", "David"], "age": [25, np.nan, 30, 22], "city": ["New York", "Los Angeles", np.nan, "Chicago"] } df = pd.DataFrame(data) print(df)
タスク
スワイプしてコーディングを開始
すべての欠損値を含む行を削除した新しいDataFrameを返す関数を作成してください。この関数は元のDataFrameを変更しないようにしてください。指定されたパラメータおよび変数のみを使用してください。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 2. 章 4
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください