Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Treningssett | Maskinlæringskonsepter
ML Introduksjon med Scikit-learn

bookTreningssett

Når vi snakker om overvåket eller ikke-overvåket læring, vil treningssettet vanligvis være i tabellform.

Se for deg diabetes-datasettet, som har som oppgave å forutsi om en person har diabetes. Det inneholder informasjon om 768 kvinner med parametere som alder, kroppsmasseindeks, blodtrykk osv. Disse parameterne kalles funksjoner.

Datasettet inneholder også informasjon om personen har diabetes i en 'Outcome'-kolonne, som er det vi ønsker å forutsi. Dette kalles målvariabel.

Hver rad i en tabell kalles en forekomst (eller datapunkt eller prøve). I dette tilfellet er det informasjon om én kvinne.

Tabellen (treningssettet) har en målvariabelkolonne, noe som betyr at den er merket.

Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye forekomster) om de har diabetes basert kun på funksjonene.

Ved koding blir funksjonskolonner vanligvis tildelt til X og målvariabelkolonner tildelt som y.

Og egenskapene til nye eksempler tildeles som X_new.

question-icon

Koble variabelnavnene til dataene de vanligvis inneholder.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 3

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 3.13

bookTreningssett

Sveip for å vise menyen

Når vi snakker om overvåket eller ikke-overvåket læring, vil treningssettet vanligvis være i tabellform.

Se for deg diabetes-datasettet, som har som oppgave å forutsi om en person har diabetes. Det inneholder informasjon om 768 kvinner med parametere som alder, kroppsmasseindeks, blodtrykk osv. Disse parameterne kalles funksjoner.

Datasettet inneholder også informasjon om personen har diabetes i en 'Outcome'-kolonne, som er det vi ønsker å forutsi. Dette kalles målvariabel.

Hver rad i en tabell kalles en forekomst (eller datapunkt eller prøve). I dette tilfellet er det informasjon om én kvinne.

Tabellen (treningssettet) har en målvariabelkolonne, noe som betyr at den er merket.

Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye forekomster) om de har diabetes basert kun på funksjonene.

Ved koding blir funksjonskolonner vanligvis tildelt til X og målvariabelkolonner tildelt som y.

Og egenskapene til nye eksempler tildeles som X_new.

question-icon

Koble variabelnavnene til dataene de vanligvis inneholder.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 3
some-alt