セクション 5. 章 3
single
NaN値はどのように処理するか?
メニューを表示するにはスワイプしてください
前の章では、次の結果を得ました:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
このデータセットは418行あります。Cabin列を見ると、327件の欠損値があります。ここでは情報がほとんどないため、これらを補完する意味はありません。この場合、最適な解決策は、私たちにとって意味のない列を削除することです。理由の一つとして、欠損値を含む行だけを削除することもできますが、418行中327行を削除することはできません。では、これをどのように行うか見ていきましょう。
列を削除するには、データセットに対して.drop()メソッドを適用します。構文は以下の通りです:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
説明:
.drop()- 列を削除するメソッド;columns = 'column_name'またはcolumns = ['column_1', 'column_2']- 削除したい列名を指定する引数;inplace = True- すべての変更を保存できるpandasの便利な引数。他の関数でも使用可能で、今後いくつか学びます。
タスク
スワイプしてコーディングを開始
最も多くのNaN値を含む列を削除することが課題です。次のアルゴリズムに従ってください。
'Cabin'引数を使用して、inplace = True列を削除します。- データセットからランダムに
5行を出力します。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 5. 章 3
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください