Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Datan Tyypit | Koneoppimisen Käsitteet
Johdatus koneoppimiseen Pythonilla

bookDatan Tyypit

Jokaisella koulutusjoukon sarakkeella (ominaisuudella) on siihen liittyvä tietotyyppi. Nämä tietotyypit voidaan ryhmitellä numeerisiin, kategorisiin sekä päivämäärä- ja/tai aika-arvoihin.

Useimmat koneoppimisalgoritmit toimivat hyvin vain numeerisen datan kanssa, joten kategoriset ja aika-arvot täytyy muuntaa numeroiksi.

Päivämäärä- ja aika-arvoista voidaan tarpeen mukaan poimia ominaisuuksia, kuten 'year', 'month' ja vastaavat. Nämä ovat jo numeerisia arvoja, joten niitä voidaan käyttää suoraan.

Kategorisen datan käsittely on hieman haastavampaa.

Kategorisen datan tyypit

Kategorinen data jaetaan kahteen tyyppiin:

  • Ordinaalidata on kategorista dataa, jossa luokat ovat luonnollisessa järjestyksessä. Esimerkiksi koulutustaso (alakoulusta tohtorintutkintoon) tai arviot (erittäin huono – erittäin hyvä) jne.

  • Nominaalidata on kategorista dataa, jossa luokilla ei ole luonnollista järjestystä. Esimerkiksi nimi, sukupuoli, kotimaa jne.

Ordinaali- ja nominaalidatan muuntaminen numeerisiksi arvoiksi vaatii erilaisia lähestymistapoja, joten ne tulee käsitellä erikseen.

Note
Lisätietoa

On olemassa parempia tapoja muuntaa päivämääriä numeerisiksi arvoiksi, mutta ne eivät kuulu tämän johdantokurssin piiriin. Esimerkiksi, jos käytämme vain 'month'-ominaisuutta, se ei huomioi sitä, että 12. kuukausi on todellisuudessa lähempänä 1. kuukautta kuin 9. kuukautta.

question-icon

Yhdistä ominaisuus ja sen tietotyyppi.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 3.13

bookDatan Tyypit

Pyyhkäise näyttääksesi valikon

Jokaisella koulutusjoukon sarakkeella (ominaisuudella) on siihen liittyvä tietotyyppi. Nämä tietotyypit voidaan ryhmitellä numeerisiin, kategorisiin sekä päivämäärä- ja/tai aika-arvoihin.

Useimmat koneoppimisalgoritmit toimivat hyvin vain numeerisen datan kanssa, joten kategoriset ja aika-arvot täytyy muuntaa numeroiksi.

Päivämäärä- ja aika-arvoista voidaan tarpeen mukaan poimia ominaisuuksia, kuten 'year', 'month' ja vastaavat. Nämä ovat jo numeerisia arvoja, joten niitä voidaan käyttää suoraan.

Kategorisen datan käsittely on hieman haastavampaa.

Kategorisen datan tyypit

Kategorinen data jaetaan kahteen tyyppiin:

  • Ordinaalidata on kategorista dataa, jossa luokat ovat luonnollisessa järjestyksessä. Esimerkiksi koulutustaso (alakoulusta tohtorintutkintoon) tai arviot (erittäin huono – erittäin hyvä) jne.

  • Nominaalidata on kategorista dataa, jossa luokilla ei ole luonnollista järjestystä. Esimerkiksi nimi, sukupuoli, kotimaa jne.

Ordinaali- ja nominaalidatan muuntaminen numeerisiksi arvoiksi vaatii erilaisia lähestymistapoja, joten ne tulee käsitellä erikseen.

Note
Lisätietoa

On olemassa parempia tapoja muuntaa päivämääriä numeerisiksi arvoiksi, mutta ne eivät kuulu tämän johdantokurssin piiriin. Esimerkiksi, jos käytämme vain 'month'-ominaisuutta, se ei huomioi sitä, että 12. kuukausi on todellisuudessa lähempänä 1. kuukautta kuin 9. kuukautta.

question-icon

Yhdistä ominaisuus ja sen tietotyyppi.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4
some-alt