Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Arbetsflöde för Maskininlärning | Maskininlärningskoncept
Introduktion till maskininlärning med Python

bookArbetsflöde för Maskininlärning

Vi går igenom arbetsflödet du skulle följa för att bygga ett framgångsrikt maskininlärningsprojekt.

Steg 1. Hämta data

Definiera problemet, välj en prestationsmetrik och bestäm vad som kvalificerar som ett bra resultat. Samla sedan in nödvändig data från tillgängliga källor och omvandla den till ett format som är redo för Python. Om datan redan finns i en CSV-fil kan förbehandlingen påbörjas omedelbart.

Exempel

Ett sjukhus sammanställer patientjournaler och demografiska uppgifter i en CSV-fil. Målet är att förutsäga återinläggningar, med målsättningen att uppnå över 80% noggrannhet.

Steg 2. Förbehandla data

Detta steg inkluderar:

  • Datastädning: hantering av saknade värden och icke-numeriska indata;
  • EDA: analys och visualisering av data för att förstå samband och upptäcka problem;
  • Feature engineering: val eller skapande av egenskaper som förbättrar modellens prestanda.

Exempel

Saknade värden (t.ex. blodtryck) fylls i och kategoriska egenskaper (t.ex. ras) omvandlas till numerisk form.

Steg 3. Modellering

Detta steg inkluderar:

  • Val av modell baserat på problemtyp och experiment;
  • Justering av hyperparametrar för att förbättra prestanda;
  • Utvärdering av modell på osedda data.
Note
Läs mer

Hyperparametrar är justerbara kontroller som definierar hur modellen tränas—såsom träningslängd eller modellkomplexitet.

Exempel

En klassificeringsmodell väljs för att förutsäga återinläggning (ja/nej). Efter justering utvärderas den på en validerings-/testuppsättning för att bedöma generalisering.

Steg 4. Driftsättning

När en modell presterar bra driftsätts den i verkliga system. Modellen måste övervakas, uppdateras med ny data och förbättras över tid, vilket ofta innebär att cykeln startar om från Steg 1.

Exempel

Modellen integreras i sjukhussystemet för att markera högriskpatienter vid inläggning, vilket hjälper personalen att agera tidigt.

Note
Notering

Vissa av de termer som nämns här kan låta obekanta, men vi kommer att gå igenom dem mer ingående senare i kursen.

Datapreprocessering och modellering kan utföras med scikit-learn. De kommande kapitlen introducerar preprocesseringsarbetsflöden och pipelines, följt av modellering med k-nearest neighbors (KNeighborsClassifier), inklusive träning, justering och utvärdering.

1. Vad är det primära syftet med steget "Hämta data" i ett maskininlärningsprojekt?

2. Vilket av följande beskriver bäst vikten av steget "Datapreprocessering" i arbetsflödet för ett maskininlärningsprojekt?

question mark

Vad är det primära syftet med steget "Hämta data" i ett maskininlärningsprojekt?

Select the correct answer

question mark

Vilket av följande beskriver bäst vikten av steget "Datapreprocessering" i arbetsflödet för ett maskininlärningsprojekt?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 5

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Awesome!

Completion rate improved to 3.13

bookArbetsflöde för Maskininlärning

Svep för att visa menyn

Vi går igenom arbetsflödet du skulle följa för att bygga ett framgångsrikt maskininlärningsprojekt.

Steg 1. Hämta data

Definiera problemet, välj en prestationsmetrik och bestäm vad som kvalificerar som ett bra resultat. Samla sedan in nödvändig data från tillgängliga källor och omvandla den till ett format som är redo för Python. Om datan redan finns i en CSV-fil kan förbehandlingen påbörjas omedelbart.

Exempel

Ett sjukhus sammanställer patientjournaler och demografiska uppgifter i en CSV-fil. Målet är att förutsäga återinläggningar, med målsättningen att uppnå över 80% noggrannhet.

Steg 2. Förbehandla data

Detta steg inkluderar:

  • Datastädning: hantering av saknade värden och icke-numeriska indata;
  • EDA: analys och visualisering av data för att förstå samband och upptäcka problem;
  • Feature engineering: val eller skapande av egenskaper som förbättrar modellens prestanda.

Exempel

Saknade värden (t.ex. blodtryck) fylls i och kategoriska egenskaper (t.ex. ras) omvandlas till numerisk form.

Steg 3. Modellering

Detta steg inkluderar:

  • Val av modell baserat på problemtyp och experiment;
  • Justering av hyperparametrar för att förbättra prestanda;
  • Utvärdering av modell på osedda data.
Note
Läs mer

Hyperparametrar är justerbara kontroller som definierar hur modellen tränas—såsom träningslängd eller modellkomplexitet.

Exempel

En klassificeringsmodell väljs för att förutsäga återinläggning (ja/nej). Efter justering utvärderas den på en validerings-/testuppsättning för att bedöma generalisering.

Steg 4. Driftsättning

När en modell presterar bra driftsätts den i verkliga system. Modellen måste övervakas, uppdateras med ny data och förbättras över tid, vilket ofta innebär att cykeln startar om från Steg 1.

Exempel

Modellen integreras i sjukhussystemet för att markera högriskpatienter vid inläggning, vilket hjälper personalen att agera tidigt.

Note
Notering

Vissa av de termer som nämns här kan låta obekanta, men vi kommer att gå igenom dem mer ingående senare i kursen.

Datapreprocessering och modellering kan utföras med scikit-learn. De kommande kapitlen introducerar preprocesseringsarbetsflöden och pipelines, följt av modellering med k-nearest neighbors (KNeighborsClassifier), inklusive träning, justering och utvärdering.

1. Vad är det primära syftet med steget "Hämta data" i ett maskininlärningsprojekt?

2. Vilket av följande beskriver bäst vikten av steget "Datapreprocessering" i arbetsflödet för ett maskininlärningsprojekt?

question mark

Vad är det primära syftet med steget "Hämta data" i ett maskininlärningsprojekt?

Select the correct answer

question mark

Vilket av följande beskriver bäst vikten av steget "Datapreprocessering" i arbetsflödet för ett maskininlärningsprojekt?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 5
some-alt