Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ インポートされた生データの操作 | データの不備を理解する
Excelでデータをクリーンデータ化

bookインポートされた生データの操作

メニューを表示するにはスワイプしてください

実際の業務では、Excelでデータセットを一から作成することはほとんどありません。多くの場合、外部ソースから取得したデータ、たとえばCSVファイル、システムからのレポート、ウェブサイトからコピーしたデータなどを扱います。このようなデータは「生のインポートデータ」と呼ばれ、Excelで問題が発生する主な原因の一つです。

主な問題は、Excelがインポートしたデータの構造や型を必ずしも正しく認識しないことです。見た目には問題がなくても、開いたり貼り付けたりした時点でデータがすでに「汚れている」場合があります。

たとえば、CSVファイルを開くと、Excelは各列をどのように解釈するか自動的に判断します。正しく推測されることもありますが、そうでない場合も多いです。数値がテキストになったり、日付が地域設定によって誤って解釈されたり、一部の値が元の書式を失うこともあります。

データをコピー&ペーストすると、独自の問題が発生します。セルの先頭や末尾に余分なスペースが入ったり、見えない文字が挿入されたり、書式が不統一になることがあります。特にウェブサイトからコピーしたデータは問題が多く、Excel上では見えないHTML関連の隠れた文字が含まれている場合があります。

重要なポイント

生のインポートデータはすぐに信用してはいけません。 使用する前に、書式が不統一であったり、値が誤って解釈されている可能性があると常に考えてください。

最初のステップは分析ではなく、データの確認と準備です。

question mark

インポートデータを扱う際の主なリスクは何ですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  3

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1.  3
some-alt