Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Cohorttoewijzingstechnieken | Cohortgegevensstructurering en Voorbereiding
Cohortanalyse met Python
Sectie 1. Hoofdstuk 1
single

single

Cohorttoewijzingstechnieken

Veeg om het menu te tonen

Cohortanalyse is een krachtige analysetechniek waarmee je gebruikers kunt groeperen op basis van gedeelde kenmerken of ervaringen binnen een bepaalde periode. De meest gebruikelijke methode is om gebruikers toe te wijzen aan cohorten op basis van de datum van hun eerste transactie of interactie. Met deze aanpak kun je volgen hoe verschillende groepen zich in de loop van de tijd gedragen, waardoor trends zoals retentie, betrokkenheid en verloop zichtbaar worden die in geaggregeerde data verborgen zouden blijven.

Het toewijzen van gebruikers aan cohorten is een fundamentele stap in cohortanalyse. Door duidelijke regels te definiëren voor cohorttoewijzing – zoals groeperen op maand of week van de eerste aankoop van een gebruiker – kun je betekenisvolle segmenten creëren voor diepgaandere analyse. Dit proces helpt niet alleen bij het identificeren van veranderingen in gebruikersgedrag, maar ondersteunt ook meer gerichte zakelijke beslissingen, zoals het evalueren van de impact van productwijzigingen of marketingcampagnes op specifieke gebruikersgroepen.

Het begrijpen en correct implementeren van cohorttoewijzing zorgt ervoor dat je analyse de werkelijke gebruikersreis weerspiegelt en bruikbare inzichten oplevert. De volgende codevoorbeeld laat zien hoe je gebruikers aan cohorten toewijst op basis van hun eerste transactiedatum in Python met pandas.

12345678910111213141516171819
import pandas as pd # Sample transaction data data = { "user_id": [1, 2, 1, 3, 2, 4], "transaction_date": [ "2024-01-15", "2024-01-20", "2024-02-10", "2024-03-05", "2024-03-10", "2024-03-15" ], "amount": [100, 150, 200, 120, 80, 90] } df = pd.DataFrame(data) df["transaction_date"] = pd.to_datetime(df["transaction_date"]) # Assigning each user to a cohort based on their first transaction month df["cohort_month"] = df.groupby("user_id")["transaction_date"].transform("min").dt.to_period("M") print(df[["user_id", "transaction_date", "cohort_month"]])

De logica achter cohorttoewijzing is het identificeren van een uniek evenement of kenmerk – meestal de eerste transactiedatum van de gebruiker – en dit gebruiken om het cohort voor elke gebruiker te bepalen. In het bovenstaande codevoorbeeld gebruik je pandas om de data te groeperen op user_id en de minimale transaction_date voor elke gebruiker te vinden. Deze datum wordt vervolgens omgezet naar een maandperiode, waarmee een cohort_month wordt gecreëerd die het cohort van de gebruiker weergeeft.

Bij het implementeren van cohorttoewijzing moet je rekening houden met randgevallen, zoals gebruikers met meerdere transacties op dezelfde dag, ontbrekende transactiedata of gebruikers die na lange afwezigheid opnieuw actief worden. Het is best practice om ervoor te zorgen dat de logica voor cohorttoewijzing robuust is voor deze situaties door ontbrekende waarden af te handelen en te valideren dat elke gebruiker precies aan één cohort wordt toegewezen op basis van hun daadwerkelijke eerste interactie.

Het volgen van deze principes helpt de integriteit van je cohorten te waarborgen, zodat de daaropvolgende analyse het gebruikersgedrag nauwkeurig weerspiegelt en solide zakelijke beslissingen ondersteunt.

Taak

Veeg om te beginnen met coderen

Je krijgt een DataFrame df met de kolommen user_id en signup_date die gebruikersregistraties weergeven. Voer de volgende stappen uit:

  • Zet de kolom signup_date om naar het datetime-formaat.
  • Bepaal voor elke gebruiker hun vroegste signup_date.
  • Maak een nieuwe kolom cohort_week aan die de wekelijkse periode (YYYY-MM-DD met wekelijkse frequentie) bevat van de eerste registratie van elke gebruiker, met behulp van de period-functionaliteit van pandas en frequentie 'W'.
  • Print de resulterende DataFrame, die de nieuwe kolom cohort_week moet bevatten.

Wijzig geen andere kolommen of de structuur van de DataFrame, behalve het toevoegen van de vereiste kolom cohort_week.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 1
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

some-alt