セクション 3. 章 6
single
欠損値の検出
メニューを表示するにはスワイプしてください
DataFrame にはしばしば 欠損値(None または NaN で表される)が含まれます。DataFrame を扱う際には、これらの欠損値を特定することが重要です。なぜなら、欠損値は計算を歪め、分析結果の精度を損ない、結果の信頼性を低下させる可能性があるためです。
欠損値への対応は、データの整合性を確保し、統計解析や機械学習などのタスクのパフォーマンス向上につながります。この目的のために、pandas には専用のメソッドが用意されています。
最初に紹介するのは isna() です。このメソッドは ブール型の DataFrame を返します。この場合、True の値は DataFrame 内に欠損値が存在することを示し、False の値は値が存在することを示します。
例として、このメソッドを animals DataFrame に適用します。isna() メソッドは DataFrame/True の値を持つ False を返し、各 True は animals DataFrame 内の欠損値を示します。
123456789import pandas as pd import numpy as np animals_data = {'animal': [np.nan, 'Dog', np.nan, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
2つ目の方法は isnull() です。これは前述の方法と全く同じ動作をし、両者に違いはありません。
タスク
スワイプしてコーディングを開始
DataFrameという名前のwine_dataが与えられています。
- この
DataFrame内の欠損値を取得し、その結果をmissing_values変数に格納してください。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 3. 章 6
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください