Treningssett
Når vi snakker om overvåket eller ikke-overvåket læring, vil treningssettet vanligvis være i tabellform.
Se for deg diabetes-datasettet, som har som oppgave å forutsi om en person har diabetes. Det inneholder informasjon om 768 kvinner med parametere som alder, kroppsmasseindeks, blodtrykk osv. Disse parameterne kalles funksjoner.
Datasettet inneholder også informasjon om personen har diabetes i en 'Outcome'
-kolonne, som er det vi ønsker å forutsi. Dette kalles målvariabel.
Hver rad i en tabell kalles en forekomst (eller datapunkt eller prøve). I dette tilfellet er det informasjon om én kvinne.
Tabellen (treningssettet) har en målvariabelkolonne, noe som betyr at den er merket.
Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye forekomster) om de har diabetes basert kun på funksjonene.
Ved koding blir funksjonskolonner vanligvis tildelt til X
og målvariabelkolonner tildelt som y
.
Og egenskapene til nye eksempler tildeles som X_new
.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.13
Treningssett
Sveip for å vise menyen
Når vi snakker om overvåket eller ikke-overvåket læring, vil treningssettet vanligvis være i tabellform.
Se for deg diabetes-datasettet, som har som oppgave å forutsi om en person har diabetes. Det inneholder informasjon om 768 kvinner med parametere som alder, kroppsmasseindeks, blodtrykk osv. Disse parameterne kalles funksjoner.
Datasettet inneholder også informasjon om personen har diabetes i en 'Outcome'
-kolonne, som er det vi ønsker å forutsi. Dette kalles målvariabel.
Hver rad i en tabell kalles en forekomst (eller datapunkt eller prøve). I dette tilfellet er det informasjon om én kvinne.
Tabellen (treningssettet) har en målvariabelkolonne, noe som betyr at den er merket.
Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye forekomster) om de har diabetes basert kun på funksjonene.
Ved koding blir funksjonskolonner vanligvis tildelt til X
og målvariabelkolonner tildelt som y
.
Og egenskapene til nye eksempler tildeles som X_new
.
Takk for tilbakemeldingene dine!