Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ データの一貫性の検証 | 重複とエラーの削除
Excelでデータをクリーンデータ化

bookデータの一貫性の検証

メニューを表示するにはスワイプしてください

重複の削除、書式の修正、エラーの強調表示が完了したら、最後のステップとしてデータが論理的に一貫していることを確認します。

データの一貫性とは、異なる列間の値を比較したときに整合性が取れていることを意味します。各列が個別に正しく見えても、列同士の関係が間違っている場合があります。

簡単な例を見てみましょう:

Product

Quantity

Price

Total

Phone

2

400

800

Phone

1

800

800

Laptop

1

1000

1000

一見すると、すべて問題ないように見えます。しかし、よく考えてみると問題があります。

2台の電話が800であれば、1台の電話も800であるべきではありません。これは、いずれかの値が誤っていることを示しています。

一貫性の検証方法

関連する列を比較し、期待されるルールに従っているかを確認。

例えば、以下のようなことが期待されます:

  • Total = Quantity × Price;
  • 値が現実的な範囲内に収まっていること;
  • 行間で一貫した関係が保たれていること。

この論理を検証するために、簡単な数式を使用可能。

動作の仕組み

列間の関係が正しいかどうかを確認する数式を作成。

例えば:

=IF(B2*C2=D2, "OK", "Error")

この数式は合計が計算と一致するかを確認。一致すればOK、そうでなければその行をErrorとしてフラグ付け。

Validationという新しい列を作成。

TotalQuantityで割って1個あたりの価格を計算する数式を作成。1個あたりの価格が2000を超える場合は"Error"、それ以外は"OK"とマーク。

この数式をすべての行に適用。

TotalQuantity で割り、その結果が 2000 より大きいかどうかを確認する数式の使用例:=IF(E2/D2>2000;"Error";"OK")

question mark

データの一貫性とは何か?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 4.  4

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 4.  4
some-alt