Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ コホート分析のための特徴量エンジニアリング | コホートデータの構造化と準備
Pythonによるコホート分析

コホート分析のための特徴量エンジニアリング

メニューを表示するにはスワイプしてください

特徴量エンジニアリングは、生データから新しい変数を作成し、分析、モデリング、またはセグメンテーションを向上させるプロセス。コホート分析において、効果的な特徴量エンジニアリングは、ユーザー行動の時間的変化に関するより深い洞察を引き出すのに役立つ。代表的な特徴量には、ユーザーライフタイム(ユーザーがアクティブであった期間)、アクティビティ回数(特定のアクションをユーザーが実行した回数)、リセンシー(ユーザーが最後にアクティブだった時期)が含まれる。これらの特徴量により、ユーザーをより意味のある形でグループ化でき、リテンション、エンゲージメント、チャーンのパターンを明らかにすることが可能。こうした特徴量を設計することで、単純なコホート割り当てを超え、より豊かで実用的なコホートを構築できる。

12345678910111213141516171819202122232425262728
import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)

コードサンプルで作成された特徴量、ユーザーライフタイムアクティビティ回数リセンシーは、コホートのセグメンテーションと分析において強力なツール。ユーザーがどれだけ長くアクティブであるか、どれだけ頻繁に利用しているか、どれだけ最近利用したかを測定することで、コホート間の意味のある違いを特定できる。たとえば、ライフタイムが長くアクティビティ回数が多いユーザーは高いエンゲージメントを持つコホートに属し、リセンシー値が高いユーザーはチャーンリスクが高い可能性がある。これらの特徴量により、単純な時間ベースのグループ分けを超え、より多次元的なセグメンテーションが可能となり、行動パターンの深い理解や、よりターゲットを絞ったビジネス戦略の立案を支援する。

question mark

次のうち、コホート分析における特徴量エンジニアリングの目的として最も適切なものはどれですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  2

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1.  2
some-alt