Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ NaN値をどのように処理するか? | データ前処理
Pandasによるデータ整形
セクション 5.  3
single

single

bookNaN値をどのように処理するか?

メニューを表示するにはスワイプしてください

前の章では、次の結果を得ました:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

このデータセットには418行があります。Cabin列を見ると、327個の欠損値があります。ここにはほとんど情報がないため、これらを埋める意味はありません。この場合、最適な解決策は、私たちにとって意味のない列を削除することです。理由の一つとして、欠損値を含む行だけを削除することもできますが、418行中327行を削除することはできません。したがって、この方法を確認しましょう。

列を削除するには、データセットに対して.drop()メソッドを適用します。構文は以下の通りです:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

説明:

  • .drop() - 列を削除するメソッド
  • columns = 'column_name' または columns = ['column_1', 'column_2'] - 削除したい列名を指定する引数
  • inplace = True - すべての変更を保存できるpandasの便利な引数。他の関数でも使用可能で、今後いくつか学びます。
タスク

スワイプしてコーディングを開始

NaN値が最も多い列を削除することが課題です。次のアルゴリズムに従ってください。

  1. 'Cabin'引数を使用して、inplace = True列を削除します。
  2. データセットからランダムに5行を出力します。

解答

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 5.  3
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt