Datatyper
Hver kolonne (funksjon) i et treningssett har en tilknyttet datatype. Disse datatypene kan grupperes i numeriske, kategoriske og dato og/eller tid.
Dessverre fungerer de fleste ML-algoritmer kun godt med tall. Derfor trenger vi en metode for å konvertere kategoriske data og dato-/tidsdata til tall.
Når det gjelder dato og tid, kan du bruke funksjoner som 'year'
, 'month'
osv., avhengig av oppgaven. Disse funksjonene er numeriske verdier, så det er ingen problemer med dem.
Kategoriske data er litt mer utfordrende å håndtere.
Typer av kategoriske data
Kategoriske data deles inn i to typer:
-
Ordinal data er en type kategoriske data der kategoriene følger en naturlig rekkefølge. For eksempel utdanningsnivå (fra barneskole til Ph.D.) eller vurderinger (fra svært dårlig til svært bra), osv.
-
Nominale data er en type kategoriske data som ikke følger noen naturlig rekkefølge. For eksempel navn, kjønn, opprinnelsesland, osv.
Som du vil se i senere kapitler, er det forskjellig hvordan man konverterer ordinal og nominale datatyper til numeriske verdier, derfor må vi skille dem.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.13
Datatyper
Sveip for å vise menyen
Hver kolonne (funksjon) i et treningssett har en tilknyttet datatype. Disse datatypene kan grupperes i numeriske, kategoriske og dato og/eller tid.
Dessverre fungerer de fleste ML-algoritmer kun godt med tall. Derfor trenger vi en metode for å konvertere kategoriske data og dato-/tidsdata til tall.
Når det gjelder dato og tid, kan du bruke funksjoner som 'year'
, 'month'
osv., avhengig av oppgaven. Disse funksjonene er numeriske verdier, så det er ingen problemer med dem.
Kategoriske data er litt mer utfordrende å håndtere.
Typer av kategoriske data
Kategoriske data deles inn i to typer:
-
Ordinal data er en type kategoriske data der kategoriene følger en naturlig rekkefølge. For eksempel utdanningsnivå (fra barneskole til Ph.D.) eller vurderinger (fra svært dårlig til svært bra), osv.
-
Nominale data er en type kategoriske data som ikke følger noen naturlig rekkefølge. For eksempel navn, kjønn, opprinnelsesland, osv.
Som du vil se i senere kapitler, er det forskjellig hvordan man konverterer ordinal og nominale datatyper til numeriske verdier, derfor må vi skille dem.
Takk for tilbakemeldingene dine!