Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Datatyper | Maskininlärningskoncept
ML-introduktion Med Scikit-learn

bookDatatyper

Varje kolumn (funktion) i en träningsuppsättning har en datatyp kopplad till sig. Dessa datatyper kan grupperas i numeriska, kategoriska och datum och/eller tid.

De flesta ML-algoritmer fungerar bra endast med numerisk data, så kategoriska och datum-/tidsvärden måste omvandlas till siffror.

För datum och tid kan egenskaper som 'year', 'month' och liknande extraheras, beroende på uppgiften. Dessa är redan numeriska värden, så de kan användas direkt.

Kategorisk data är något mer utmanande att hantera.

Typer av kategoriska data

Kategoriska data delas in i två typer:

  • Ordinal data är en typ av kategoriska data där kategorierna har en naturlig ordning. Exempelvis utbildningsnivå (från grundskola till doktorsexamen) eller betyg (från mycket dåligt till mycket bra), etc.

  • Nominal data är en typ av kategoriska data som inte har någon naturlig ordning. Exempelvis namn, kön, ursprungsland, etc.

Omvandling av ordinala och nominala datatyper till numeriska värden kräver olika metoder, så de måste hanteras separat.

Note
Läs mer

Det finns bättre sätt att omvandla datum till numeriska värden som ligger utanför ramen för denna introduktionskurs. Till exempel, om vi endast använder egenskapen 'month', tar det inte hänsyn till att 12:e månaden faktiskt ligger närmare 1:a än 9:e.

question-icon

Matcha egenskapen med dess datatyp.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 4

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you explain how to convert ordinal data into numerical values?

What are the common methods for encoding nominal data?

Why do machine learning algorithms require numerical data?

Awesome!

Completion rate improved to 3.13

bookDatatyper

Svep för att visa menyn

Varje kolumn (funktion) i en träningsuppsättning har en datatyp kopplad till sig. Dessa datatyper kan grupperas i numeriska, kategoriska och datum och/eller tid.

De flesta ML-algoritmer fungerar bra endast med numerisk data, så kategoriska och datum-/tidsvärden måste omvandlas till siffror.

För datum och tid kan egenskaper som 'year', 'month' och liknande extraheras, beroende på uppgiften. Dessa är redan numeriska värden, så de kan användas direkt.

Kategorisk data är något mer utmanande att hantera.

Typer av kategoriska data

Kategoriska data delas in i två typer:

  • Ordinal data är en typ av kategoriska data där kategorierna har en naturlig ordning. Exempelvis utbildningsnivå (från grundskola till doktorsexamen) eller betyg (från mycket dåligt till mycket bra), etc.

  • Nominal data är en typ av kategoriska data som inte har någon naturlig ordning. Exempelvis namn, kön, ursprungsland, etc.

Omvandling av ordinala och nominala datatyper till numeriska värden kräver olika metoder, så de måste hanteras separat.

Note
Läs mer

Det finns bättre sätt att omvandla datum till numeriska värden som ligger utanför ramen för denna introduktionskurs. Till exempel, om vi endast använder egenskapen 'month', tar det inte hänsyn till att 12:e månaden faktiskt ligger närmare 1:a än 9:e.

question-icon

Matcha egenskapen med dess datatyp.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 4
some-alt