Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Datatyper | Maskinlæringskonsepter
ML Introduksjon med Scikit-learn

bookDatatyper

Hver kolonne (funksjon) i et treningssett har en tilknyttet datatype. Disse datatypene kan grupperes i numeriske, kategoriske og dato og/eller tid.

Dessverre fungerer de fleste ML-algoritmer kun godt med tall. Derfor trenger vi en metode for å konvertere kategoriske data og dato-/tidsdata til tall.

Når det gjelder dato og tid, kan du bruke funksjoner som 'year', 'month' osv., avhengig av oppgaven. Disse funksjonene er numeriske verdier, så det er ingen problemer med dem.

Kategoriske data er litt mer utfordrende å håndtere.

Typer av kategoriske data

Kategoriske data deles inn i to typer:

  • Ordinal data er en type kategoriske data der kategoriene følger en naturlig rekkefølge. For eksempel utdanningsnivå (fra barneskole til Ph.D.) eller vurderinger (fra svært dårlig til svært bra), osv.

  • Nominale data er en type kategoriske data som ikke følger noen naturlig rekkefølge. For eksempel navn, kjønn, opprinnelsesland, osv.

Som du vil se i senere kapitler, er det forskjellig hvordan man konverterer ordinal og nominale datatyper til numeriske verdier, derfor må vi skille dem.

question-icon

Koble egenskapen til riktig datatype.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 4

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 3.13

bookDatatyper

Sveip for å vise menyen

Hver kolonne (funksjon) i et treningssett har en tilknyttet datatype. Disse datatypene kan grupperes i numeriske, kategoriske og dato og/eller tid.

Dessverre fungerer de fleste ML-algoritmer kun godt med tall. Derfor trenger vi en metode for å konvertere kategoriske data og dato-/tidsdata til tall.

Når det gjelder dato og tid, kan du bruke funksjoner som 'year', 'month' osv., avhengig av oppgaven. Disse funksjonene er numeriske verdier, så det er ingen problemer med dem.

Kategoriske data er litt mer utfordrende å håndtere.

Typer av kategoriske data

Kategoriske data deles inn i to typer:

  • Ordinal data er en type kategoriske data der kategoriene følger en naturlig rekkefølge. For eksempel utdanningsnivå (fra barneskole til Ph.D.) eller vurderinger (fra svært dårlig til svært bra), osv.

  • Nominale data er en type kategoriske data som ikke følger noen naturlig rekkefølge. For eksempel navn, kjønn, opprinnelsesland, osv.

Som du vil se i senere kapitler, er det forskjellig hvordan man konverterer ordinal og nominale datatyper til numeriske verdier, derfor må vi skille dem.

question-icon

Koble egenskapen til riktig datatype.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 4
some-alt