Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Maskinlæringsarbejdsgang | Maskinlæringskoncepter
Introduktion til Maskinlæring med Python

bookMaskinlæringsarbejdsgang

Lad os se på arbejdsgangen, du ville følge for at opbygge et succesfuldt maskinlæringsprojekt.

Trin 1. Indsamling af data

Definer problemet, vælg en performancemåling, og afgør, hvad der kvalificerer som et godt resultat. Indsaml derefter de nødvendige data fra tilgængelige kilder og bring dem i et format, der er klar til Python. Hvis dataene allerede findes i en CSV-fil, kan forbehandling påbegyndes med det samme.

Eksempel

Et hospital samler patientjournaler og demografiske oplysninger i en CSV-fil. Målet er at forudsige genindlæggelser med et mål om over 80% nøjagtighed.

Trin 2. Forbehandling af data

Dette trin omfatter:

  • Datavask: håndtering af manglende værdier og ikke-numeriske input;
  • EDA: analyse og visualisering af data for at forstå relationer og opdage problemer;
  • Feature engineering: udvælgelse eller oprettelse af features, der forbedrer modellens ydeevne.

Eksempel

Manglende værdier (f.eks. blodtryk) udfyldes, og kategoriske features (f.eks. race) konverteres til numerisk form.

Trin 3. Modellering

Dette trin omfatter:

  • Valg af model baseret på problemtype og eksperimenter;
  • Justering af hyperparametre for at forbedre ydeevnen;
  • Modelvurdering på usete data.
Note
Læs Mere

Hyperparametre fungerer som justerbare kontroller, der definerer, hvordan modellen trænes—såsom træningsvarighed eller modelkompleksitet.

Eksempel

En klassifikationsmodel vælges til at forudsige genindlæggelse (ja/nej). Efter justering evalueres den på et validerings-/test-sæt for at vurdere generalisering.

Trin 4. Implementering

Når en model præsterer tilfredsstillende, implementeres den i virkelige systemer. Modellen skal overvåges, opdateres med nye data og forbedres over tid, hvilket ofte betyder, at processen starter forfra fra Trin 1.

Eksempel

Modellen integreres i hospitalsystemet for at markere højrisikopatienter ved indlæggelse, hvilket hjælper personalet med at handle tidligt.

Note
Bemærk

Nogle af de begreber, der nævnes her, kan virke ukendte, men vi gennemgår dem mere detaljeret senere i dette kursus.

Databehandling og modellering kan udføres med scikit-learn. De næste kapitler introducerer arbejdsgange for forbehandling og pipelines, efterfulgt af modellering med k-nærmeste naboer (KNeighborsClassifier), herunder træning, tuning og evaluering.

1. Hvad er det primære formål med trin "Hent data" i et maskinlæringsprojekt?

2. Hvilket af følgende beskriver bedst vigtigheden af trin "Databehandling" i arbejdsgangen for et maskinlæringsprojekt?

question mark

Hvad er det primære formål med trin "Hent data" i et maskinlæringsprojekt?

Select the correct answer

question mark

Hvilket af følgende beskriver bedst vigtigheden af trin "Databehandling" i arbejdsgangen for et maskinlæringsprojekt?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 5

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 3.13

bookMaskinlæringsarbejdsgang

Stryg for at vise menuen

Lad os se på arbejdsgangen, du ville følge for at opbygge et succesfuldt maskinlæringsprojekt.

Trin 1. Indsamling af data

Definer problemet, vælg en performancemåling, og afgør, hvad der kvalificerer som et godt resultat. Indsaml derefter de nødvendige data fra tilgængelige kilder og bring dem i et format, der er klar til Python. Hvis dataene allerede findes i en CSV-fil, kan forbehandling påbegyndes med det samme.

Eksempel

Et hospital samler patientjournaler og demografiske oplysninger i en CSV-fil. Målet er at forudsige genindlæggelser med et mål om over 80% nøjagtighed.

Trin 2. Forbehandling af data

Dette trin omfatter:

  • Datavask: håndtering af manglende værdier og ikke-numeriske input;
  • EDA: analyse og visualisering af data for at forstå relationer og opdage problemer;
  • Feature engineering: udvælgelse eller oprettelse af features, der forbedrer modellens ydeevne.

Eksempel

Manglende værdier (f.eks. blodtryk) udfyldes, og kategoriske features (f.eks. race) konverteres til numerisk form.

Trin 3. Modellering

Dette trin omfatter:

  • Valg af model baseret på problemtype og eksperimenter;
  • Justering af hyperparametre for at forbedre ydeevnen;
  • Modelvurdering på usete data.
Note
Læs Mere

Hyperparametre fungerer som justerbare kontroller, der definerer, hvordan modellen trænes—såsom træningsvarighed eller modelkompleksitet.

Eksempel

En klassifikationsmodel vælges til at forudsige genindlæggelse (ja/nej). Efter justering evalueres den på et validerings-/test-sæt for at vurdere generalisering.

Trin 4. Implementering

Når en model præsterer tilfredsstillende, implementeres den i virkelige systemer. Modellen skal overvåges, opdateres med nye data og forbedres over tid, hvilket ofte betyder, at processen starter forfra fra Trin 1.

Eksempel

Modellen integreres i hospitalsystemet for at markere højrisikopatienter ved indlæggelse, hvilket hjælper personalet med at handle tidligt.

Note
Bemærk

Nogle af de begreber, der nævnes her, kan virke ukendte, men vi gennemgår dem mere detaljeret senere i dette kursus.

Databehandling og modellering kan udføres med scikit-learn. De næste kapitler introducerer arbejdsgange for forbehandling og pipelines, efterfulgt af modellering med k-nærmeste naboer (KNeighborsClassifier), herunder træning, tuning og evaluering.

1. Hvad er det primære formål med trin "Hent data" i et maskinlæringsprojekt?

2. Hvilket af følgende beskriver bedst vigtigheden af trin "Databehandling" i arbejdsgangen for et maskinlæringsprojekt?

question mark

Hvad er det primære formål med trin "Hent data" i et maskinlæringsprojekt?

Select the correct answer

question mark

Hvilket af følgende beskriver bedst vigtigheden af trin "Databehandling" i arbejdsgangen for et maskinlæringsprojekt?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 5
some-alt