Oppiskele Kohortin Määrittelytekniikat | Kohorttidatan Jäsentely ja Valmistelu

Osio 1. Luku 1

single

Pyyhkäise näyttääksesi valikon

Kohorttianalyysi on tehokas analytiikan menetelmä, jonka avulla käyttäjät voidaan ryhmitellä yhteisten ominaisuuksien tai kokemusten perusteella määritellyn ajanjakson sisällä. Yleisin tapa on jakaa käyttäjät kohortteihin heidän ensimmäisen tapahtumansa tai vuorovaikutuksensa päivämäärän mukaan. Tämän lähestymistavan avulla voidaan seurata, miten eri ryhmät käyttäytyvät ajan myötä, ja havaita trendejä, kuten pysyvyys, sitoutuminen ja poistuma, jotka jäisivät piiloon kokonaisdatassa.

Käyttäjien kohortteihin jakaminen on kohorttianalyysin perusvaihe. Määrittelemällä selkeät säännöt kohorttien muodostamiselle – esimerkiksi ryhmittely käyttäjän ensimmäisen ostoksen kuukauden tai viikon mukaan – voidaan luoda merkityksellisiä segmenttejä syvällisempää analyysiä varten. Tämä prosessi auttaa tunnistamaan käyttäjäkäyttäytymisen muutoksia ja tukee kohdennetumpia liiketoimintapäätöksiä, kuten tuotemuutosten tai markkinointikampanjoiden vaikutusten arviointia tiettyihin käyttäjäryhmiin.

Oikein toteutettu kohorttien muodostaminen varmistaa, että analyysi heijastaa todellisia käyttäjäpolkuja ja tarjoaa käyttökelpoisia oivalluksia. Seuraava koodiesimerkki näyttää, miten käyttäjät voidaan jakaa kohortteihin heidän ensimmäisen tapahtumapäivänsä perusteella Pythonin pandas-kirjastolla.


              12345678910111213141516171819
            
import pandas as pd

# Sample transaction data
data = {
    "user_id": [1, 2, 1, 3, 2, 4],
    "transaction_date": [
        "2024-01-15", "2024-01-20", "2024-02-10",
        "2024-03-05", "2024-03-10", "2024-03-15"
    ],
    "amount": [100, 150, 200, 120, 80, 90]
}

df = pd.DataFrame(data)
df["transaction_date"] = pd.to_datetime(df["transaction_date"])

# Assigning each user to a cohort based on their first transaction month
df["cohort_month"] = df.groupby("user_id")["transaction_date"].transform("min").dt.to_period("M")

print(df[["user_id", "transaction_date", "cohort_month"]])

Kohorttien muodostamisen logiikkana on tunnistaa yksilöllinen tapahtuma tai ominaisuus – useimmiten käyttäjän ensimmäinen tapahtumapäivä – ja käyttää sitä kunkin käyttäjän kohortin määrittämiseen. Yllä olevassa koodiesimerkissä käytetään pandas-kirjastoa datan ryhmittelyyn user_id-kentän mukaan ja etsitään kullekin käyttäjälle pienin transaction_date. Tämä päivämäärä muunnetaan kuukausitasolle, jolloin muodostuu cohort_month, joka edustaa käyttäjän kohorttia.

Kohorttien muodostuksessa on hyvä huomioida poikkeustapaukset, kuten käyttäjät, joilla on useita tapahtumia samana päivänä, puuttuvat tapahtumapäivät tai käyttäjät, jotka palaavat järjestelmään pitkän tauon jälkeen. On suositeltavaa varmistaa, että kohorttien muodostamisen logiikka kestää nämä tilanteet käsittelemällä puuttuvat arvot ja varmistamalla, että jokainen käyttäjä liitetään täsmälleen yhteen kohorttiin todellisen ensimmäisen vuorovaikutuksen perusteella.

Näiden periaatteiden noudattaminen auttaa säilyttämään kohorttien eheyden, jolloin myöhempi analyysi heijastaa tarkasti käyttäjäkäyttäytymistä ja tukee luotettavia liiketoimintapäätöksiä.

Tehtävä

Pyyhkäise aloittaaksesi koodauksen

Sinulle annetaan DataFrame df, jossa on sarakkeet user_id ja signup_date, jotka kuvaavat käyttäjien rekisteröitymisiä. Suorita seuraavat vaiheet:

Muunna signup_date-sarake datetime-muotoon.
Tunnista jokaiselle käyttäjälle varhaisin signup_date.
Luo uusi sarake cohort_week, joka sisältää kunkin käyttäjän ensimmäisen rekisteröitymispäivän viikkokohtaisen periodin (YYYY-MM-DD viikkotiheydellä) hyödyntäen pandas-kirjaston period-toiminnallisuutta ja 'W'-frekvenssiä.
Tulosta tuloksena oleva DataFrame, jonka tulee sisältää uusi cohort_week-sarake.

Älä muuta muita sarakkeita tai DataFramen rakennetta, paitsi lisäämällä vaadittu cohort_week-sarake.

Ratkaisu

Vaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 1. Luku 1

single

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme