セクション 5. 章 3
single
NaN値をどのように処理するか?
メニューを表示するにはスワイプしてください
前の章では、次の結果を得ました:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
このデータセットには418行があります。Cabin列を見ると、327個の欠損値があります。ここにはほとんど情報がないため、これらを埋める意味はありません。この場合、最適な解決策は、私たちにとって意味のない列を削除することです。理由の一つとして、欠損値を含む行だけを削除することもできますが、418行中327行を削除することはできません。したがって、この方法を確認しましょう。
列を削除するには、データセットに対して.drop()メソッドを適用します。構文は以下の通りです:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
説明:
.drop()- 列を削除するメソッドcolumns = 'column_name'またはcolumns = ['column_1', 'column_2']- 削除したい列名を指定する引数inplace = True- すべての変更を保存できるpandasの便利な引数。他の関数でも使用可能で、今後いくつか学びます。
タスク
スワイプしてコーディングを開始
NaN値が最も多い列を削除することが課題です。次のアルゴリズムに従ってください。
'Cabin'引数を使用して、inplace = True列を削除します。- データセットからランダムに
5行を出力します。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 5. 章 3
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください