クリーンデータの準備
メニューを表示するにはスワイプしてください
実際のデータセットには、不統一な書式設定、余分なスペース、乱雑なテキスト値が含まれていることが多いです。この章では、検索やレポートで使用する前に顧客データをクリーンアップし、標準化します。
顧客データセットをダウンロードし、演習を始める前にExcelにインポートしてください。
TRIM関数とPROPER関数
=PROPER(TRIM(Customers!B2))
TRIM(): 余分なスペースを削除PROPER(): 文字の大文字・小文字を修正
文字列の大文字・小文字関数
=UPPER(TRIM(Customers!B2))
=LOWER(TRIM(Customers!B2))
UPPER(): 文字列を大文字に変換;LOWER(): 文字列を小文字に変換。
SUBSTITUTE関数
=SUBSTITUTE(Customers!C2, " ", "")
" ": 置換対象の文字;"": 置換後の値;- メールアドレスの値からすべてのスペースを削除。
文字列抽出関数
=RIGHT(A2, 3)
=LEFT(A2, 2)
=MID(A2, 2, 3)
RIGHT(): 末尾から文字列を抽出;LEFT(): 先頭から文字列を抽出;MID(): 中央から文字列を抽出。
TEXT関数
=TEXT(Customers!D2, "MMM YYYY")
変換結果:
15/03/2023 → Mar 2023
ステップ1 顧客データセットのインポート
次の手順へ:
Data → Get Data → From Text/CSV
Excelに読み込む前にデータセットをプレビュー。
使用方法:
Use First Row as Headers
新しいワークシートにデータセットを読み込み。
ステップ2 クリーンテーブルの作成
新しいワークシート名:
Customers_Clean
次の列を追加:
Customer_ID
Full_Name_Clean
ステップ3 顧客IDのコピー
最初のCustomer_IDセルに入力:
=Customers!A2
数式を列全体にコピー。
ステップ4 顧客名のクリーンアップ
最初のFull_Name_Cleanセルに入力:
=PROPER(TRIM(Customers!B2))
数式を列全体にコピー。
ステップ5 メールアドレス値のクリーンアップ
新しい列に入力:
=SUBSTITUTE(Customers!C2, " ", "")
メールアドレスから無効なスペースを削除。
ステップ6 顧客IDセグメントの抽出
右側からの抽出:
=RIGHT(A2, 3)
中央からの抽出:
=MID(A2, 2, 3)
ステップ7 レポート用日付フォーマット
入力:
=TEXT(Customers!D2, "MMM YYYY")
日付のレポート用フォーマットを標準化。
1. なぜTRIMだけではメールアドレスを十分にクリーンアップできないのですか?
2. この数式は何をしますか?
3. このレッスンで TEXT 関数の目的は何ですか?
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 6
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 1. 章 6