セクション 5. 章 4
single
NaN値のみを削除する方法
メニューを表示するにはスワイプしてください
NaN値の処理方法の一つを扱いましたが、他の方法についても考えてみましょう。各列の外れ値の数をもう一度確認してください。
前の章で得られた結果は以下の通りです:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Embarked | 0 |
最も簡単な方法は、欠損値を含むすべての行を削除することです。例えば、'Age'列には86行、1列には'Fare'行の欠損値があります。これらをどのように削除できるか見てみましょう。pandasでは、前章と同様に .dropna()というシンプルなメソッドを使って削除できます:
data.dropna(inplace=True)
ここで、inplace=Trueを指定するとすべての変更が保存されます。この関数について説明します。'Age'列の行にNaN値がある場合、このメソッドは同じ行のすべての値を削除します。行内に1つでも欠損値があれば、その行全体が削除されます。
タスク
スワイプしてコーディングを開始
ここでの課題は、すべての欠損値を削除し、正しく処理できたかを確認することです。
NaN引数を使ってinplace=True値を削除します。NaN値の数を計算します。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 5. 章 4
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください