セクション 1. 章 16
single
欠損値の検出
メニューを表示するにはスワイプしてください
DataFrame にはしばしば 欠損値(None または NaN で表現)が含まれる。DataFrame を扱う際には、これらの欠損値を特定することが重要であり、計算の歪み、不正確な分析、結果の信頼性低下につながる可能性がある。
欠損値への対応は、データの整合性を確保し、統計解析や機械学習などのタスクのパフォーマンス向上に寄与する。この目的のために、pandas には専用のメソッドが用意されている。
最初に紹介するのは isna() であり、ブール値の DataFrame を返す。この場合、True は DataFrame 内の欠損値を示し、False は値が存在することを示す。
例として、このメソッドを animals DataFrame に適用する。isna() メソッドは DataFrame/True の値を持つ False を返し、各 True が animals DataFrame 内の欠損値を示す。
123456789import pandas as pd import numpy as np animals_data = {'animal': [np.nan, 'Dog', np.nan, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
2番目のメソッドは isnull() です。これは前述のメソッドと全く同じ動作をし、両者に明確な違いはありません。
タスク
スワイプしてコーディングを開始
DataFrameという名前のwine_dataが与えられています。
- この
DataFrame内の欠損値を取得し、その結果をmissing_values変数に格納してください。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 16
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください