Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Treningssett | Maskinlæringskonsepter
Introduksjon til ML med Scikit-learn

bookTreningssett

I veiledet eller uveiledet læring presenteres treningssettet vanligvis i tabellformat.

Et eksempel er diabetesdatasettet, som brukes til å forutsi om en person har diabetes. Det inneholder oppføringer for 768 kvinner med parametere som alder, kroppsmasseindeks og blodtrykk. Disse parameterne kalles funksjoner.

Datasettet inkluderer også en 'Outcome'-kolonne som indikerer om personen har diabetes. Dette er målvariabelen.

Hver rad i tabellen er en instans (også kalt et datapunkt eller en prøve), som representerer informasjon om én enkelt person.

Tabellen (treningssettet) har en målkolonne, noe som betyr at den er merket.

Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye instanser) om de har diabetes basert kun på funksjonene.

Note
Merk

Dette treningssettet er et eksempel på et skjevt datasett, ettersom det utelukkende inneholder informasjon om kvinner som er minst 21 år gamle. Derfor kan modellen gi mindre nøyaktige prediksjoner for menn eller for kvinner under 21 år, siden den ikke er trent på disse gruppene.

Ved koding blir funksjonskolonner vanligvis tildelt til X og målkolonner tildelt som y.

Og funksjoner for nye instanser tildeles som X_new.

question-icon

Koble variabelnavnene med dataene de vanligvis inneholder.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 3

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 3.13

bookTreningssett

Sveip for å vise menyen

I veiledet eller uveiledet læring presenteres treningssettet vanligvis i tabellformat.

Et eksempel er diabetesdatasettet, som brukes til å forutsi om en person har diabetes. Det inneholder oppføringer for 768 kvinner med parametere som alder, kroppsmasseindeks og blodtrykk. Disse parameterne kalles funksjoner.

Datasettet inkluderer også en 'Outcome'-kolonne som indikerer om personen har diabetes. Dette er målvariabelen.

Hver rad i tabellen er en instans (også kalt et datapunkt eller en prøve), som representerer informasjon om én enkelt person.

Tabellen (treningssettet) har en målkolonne, noe som betyr at den er merket.

Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye instanser) om de har diabetes basert kun på funksjonene.

Note
Merk

Dette treningssettet er et eksempel på et skjevt datasett, ettersom det utelukkende inneholder informasjon om kvinner som er minst 21 år gamle. Derfor kan modellen gi mindre nøyaktige prediksjoner for menn eller for kvinner under 21 år, siden den ikke er trent på disse gruppene.

Ved koding blir funksjonskolonner vanligvis tildelt til X og målkolonner tildelt som y.

Og funksjoner for nye instanser tildeles som X_new.

question-icon

Koble variabelnavnene med dataene de vanligvis inneholder.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 3
some-alt