Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ データ整合性の検証 | セクション
データクリーニング&準備

データ整合性の検証

メニューを表示するにはスワイプしてください

重複の除去、フォーマットの修正、エラーの強調表示が完了したら、最終ステップとしてデータが論理的に一貫しているかを確認します。

データの一貫性とは、異なる列間で値を比較したときに整合性が取れていることを意味します。各列が個別に正しく見えても、列同士の関係が間違っている場合があります。

簡単な例を見てみましょう:

一見すると、すべて問題ないように見えます。しかし、よく考えてみると問題があります。

2台の電話の価格が800であれば、1台の電話も800であるべきではありません。このことから、いずれかの値が誤っていることが示唆されます。

一貫性の検証方法

関連する列を比較し、期待されるルールに従っているかを確認。

例:

  • Total = Quantity × Price;
  • 値が現実的な範囲内に収まっていること;
  • 行間で一貫した関係が保たれていること。

この論理を検証するために、簡単な数式を使用。

動作の仕組み

列間の関係が正しいかどうかを確認する数式を作成。

例:

=IF(B2*C2=D2, "OK", "Error")

この数式は合計が計算と一致するかを確認。一致すればOK、そうでなければその行をErrorとしてフラグ付け。

Validationという新しい列を作成。

TotalQuantityで割って1個あたりの価格を計算する数式を記述。1個あたりの価格が2000を超える場合は"Error"、それ以外は"OK"とマーク。

この数式をすべての行に適用。

TotalQuantity で割り、その結果が 2000 より大きいかどうかを確認する数式の使用例:=IF(E2/D2>2000;"Error";"OK")

question mark

データの一貫性とは何か?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  14

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1.  14
some-alt