Copilot を使用して重複を削除する
メニューを表示するにはスワイプしてください
データセットのクリーニングが完了したら、最後のステップは重複の削除。
多くの場合、重複行は完全に一致しているとは限りません。同じ人物が異なる値で複数回登場することがあるため、何を重複と見なすかを定義する必要があります。
重複の正しい定義
行全体を比較するのではなく、キーとなる列に注目します。この場合、重複を特定するためにメールアドレスを使用します。
これにより、各人物がデータセット内に一度だけ現れることが保証されます。
削除前のデータ保存
重複をすぐに削除しないでください。これらの行には有用な情報が含まれている場合があります。
まず、すべての重複エントリを別のワークシートにコピーします。その後、メインテーブルから削除します。
これによりデータが安全に保たれ、削除したエントリを後で確認できます。
明確なステップバイステッププロンプトの活用
複数ステップの作業を行う場合、プロンプトは明確な順序で記述します。
新しいワークシートを作成し、メールアドレスを基準に重複を特定し、それらを新しいシートにコピーし、元のテーブルから削除します。
明確な指示はエラーを減らし、Copilotの動作を予測しやすくします。
結果の確認
タスク実行後、両方のシートを確認します。
メインテーブルに一意のエントリのみが残り、削除されたすべての行が新しいワークシートに保存されていることを確認します。
まとめ
Copilotを使って乱雑なデータを整理・構造化しました。データセットは一貫性があり、完全で、次のセクションでの分析に備えています。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 2. 章 5
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 2. 章 5