Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ 重複データの検索と削除 | Excelデータのクリーニングと準備
Excelデータクリーニングと準備

重複データの検索と削除

メニューを表示するにはスワイプしてください

データセットを扱う際、最も一般的な構造上の問題の一つが重複行です。これは同じデータが複数回現れるレコードであり、通常は同一の情報を表しています。

重複は、複数のソースからデータを統合した場合や、何度もインポートした場合、または手動で入力した場合によく発生します。一見問題がないように見えても、重複は分析結果を大きく歪める可能性があります。例えば、合計値が過大になったり、レポートが誤った結果を示したりします。

重複の検出

何かを削除する前に、まず重複を特定することが重要です。

その一つの方法として、COUNTIF 関数を使用します:

=COUNTIF(A:A, A2)

この数式は、列内で値が何回出現するかをカウントします。結果が1より大きい場合、その値は重複していることを意味します。

重複の削除

重複が特定できたら、Excelにはそれらを削除するための組み込みツールがあります。

テーブルを選択し、データタブに移動して重複の削除を使用します。Excelは選択した列をスキャンし、繰り返しのある行を自動的に削除します。

Excelは選択した列を行ごとに比較します。同一の値が見つかった場合、1つだけ残し、残りを削除します。これにより、各レコードが一度だけ表示されることが保証されます。

タスク

  • データセット内の重複レコードの検索

  • Order ID列に重複が含まれていることに気付く場合があります。まずこれらの重複レコードを特定し、重複の削除ツールを使って重複した行を完全に削除してください。

=COUNTIF(A:A, A2) 列で Order ID を使用して、各IDが出現する回数をカウントします。結果が1より大きい場合、その値は重複しています。

question mark

なぜデータセットにおいて重複が問題となるのですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  14

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1.  14
some-alt