CLEAN関数による隠し文字の削除
メニューを表示するにはスワイプしてください
余分なスペースを削除した後、テキストデータでよく見られるもう一つの問題は、隠れた(非表示)文字です。
これらの文字はExcel上では見えませんが、次のような場合によく現れます:
- ウェブサイトからデータをコピーした場合;
- CSVファイルをインポートした場合;
- システムからエクスポートされたデータを扱う場合。
例えば、セル内にタブや改行、その他の不可視記号が含まれていることがあります。見た目は通常のテキストですが、Excelはこれを異なるものとして扱います。これにより、数式や比較、テキスト処理が正しく動作しなくなることがあります。
例
Name |
|---|
John\tDoe |
Anna\nSmith |
一見すると、すべて正常に見えます。しかし、最初の値には単語の間にタブが含まれており、2つ目の値にはセル内に改行が含まれています。これらの隠れた記号は、データ処理時のロジックを壊す原因となります。
記号 \t と \n は特殊文字を表します:\t はタブ(単語間の大きなスペース)、\n は新しい行(同じセル内での改行)を意味します。
これらは**非表示(印刷不可)**文字であり、Excel では通常、目に見える記号として表示されません。テキストだけが表示されますが、Excel はこれらの文字をバックグラウンドで処理しています。
CLEAN関数
この問題を解決するために、Excel には CLEAN 関数が用意されています。
この関数はテキストからすべての印刷不可文字を削除します。つまり、見えない記号を取り除き、読みやすい内容だけを残します。
=CLEAN(A2)
CLEAN を適用すると、Excel はテキストを処理し、隠れた文字を削除します。
新しい列(例:Clean Text)を作成し、元の列の値に CLEAN 関数を適用します。
メインデータセットの中から隠れた文字が含まれている可能性のある任意の列を選択できます。その後、数式を下にコピーして、すべての行が処理されてクリーンになります。
隠し文字は目に見えませんが、テキストがきれいに見えても正しく動作しない場合は、CLEAN() を適用してこれらを削除してください。
フィードバックありがとうございます!
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください