Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Implementering på et Reelt Datasæt | Sektion
Grundlæggende Ikke-Superviseret Læring

bookImplementering på et Reelt Datasæt

Du vil bruge mall customers datasættet, som indeholder følgende kolonner:

Du bør også følge disse trin før klyngedannelse:

  1. Indlæs data: du bruger pandas til at indlæse CSV-filen;
  2. Vælg relevante funktioner: du fokuserer på kolonnerne 'Annual Income (k$)' og 'Spending Score (1-100)';
  3. Skalering af data (vigtigt for DBSCAN): da DBSCAN anvender afstandsberegninger, er det afgørende at skalere funktionerne, så de har lignende intervaller. Du kan bruge StandardScaler til dette formål.

Fortolkning

Koden opretter 5 klynger i dette tilfælde. Det er vigtigt at analysere de resulterende klynger for at opnå indsigt i kundesegmentering. For eksempel kan du finde klynger, der repræsenterer:

  • Høj indkomst, højt forbrug;
  • Høj indkomst, lavt forbrug;
  • Lav indkomst, højt forbrug;
  • Lav indkomst, lavt forbrug;
  • Mellemindkomst, mellemforbrug.

Afsluttende bemærkninger

question mark

Hvilken påstand beskriver bedst en vigtig fordel ved at bruge DBSCAN til klyngeanalyse af mall customers-datasættet?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 23

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

bookImplementering på et Reelt Datasæt

Stryg for at vise menuen

Du vil bruge mall customers datasættet, som indeholder følgende kolonner:

Du bør også følge disse trin før klyngedannelse:

  1. Indlæs data: du bruger pandas til at indlæse CSV-filen;
  2. Vælg relevante funktioner: du fokuserer på kolonnerne 'Annual Income (k$)' og 'Spending Score (1-100)';
  3. Skalering af data (vigtigt for DBSCAN): da DBSCAN anvender afstandsberegninger, er det afgørende at skalere funktionerne, så de har lignende intervaller. Du kan bruge StandardScaler til dette formål.

Fortolkning

Koden opretter 5 klynger i dette tilfælde. Det er vigtigt at analysere de resulterende klynger for at opnå indsigt i kundesegmentering. For eksempel kan du finde klynger, der repræsenterer:

  • Høj indkomst, højt forbrug;
  • Høj indkomst, lavt forbrug;
  • Lav indkomst, højt forbrug;
  • Lav indkomst, lavt forbrug;
  • Mellemindkomst, mellemforbrug.

Afsluttende bemærkninger

question mark

Hvilken påstand beskriver bedst en vigtig fordel ved at bruge DBSCAN til klyngeanalyse af mall customers-datasættet?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 23
some-alt