Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Datan Tyypit | Koneoppimisen Käsitteet
Johdatus koneoppimiseen Pythonilla

Datan Tyypit

Pyyhkäise näyttääksesi valikon

Jokaisella koulutusjoukon sarakkeella (ominaisuudella) on siihen liittyvä tietotyyppi. Nämä tietotyypit voidaan ryhmitellä numeerisiin, kategorisiin ja päivämäärä- ja/tai aika -tyyppeihin.

Tietotyypit

Useimmat koneoppimisalgoritmit toimivat hyvin vain numeerisen datan kanssa, joten kategoriset ja aika-arvot täytyy muuntaa numeroiksi.

Päivämäärä- ja aikatiedoista voidaan tehtävän mukaan poimia ominaisuuksia, kuten 'year', 'month' ja vastaavat. Nämä ovat jo numeerisia arvoja, joten niitä voidaan käyttää suoraan.

kuva

Kategorinen data on hieman haastavampaa käsitellä.

Kategorisen datan tyypit

Kategorinen data jaetaan kahteen tyyppiin:

  • Ordinaalinen data on kategorista dataa, jossa luokilla on luonnollinen järjestys. Esimerkiksi koulutustaso (alakoulusta tohtorintutkintoon) tai arviot (erittäin huono – erittäin hyvä) jne.;

  • Nominaalinen data on kategorista dataa, jossa luokilla ei ole luonnollista järjestystä. Esimerkiksi nimi, sukupuoli, kotimaa jne.

Kategoristen tietotyyppien tyypit

Ordinaalisten ja nominaalisten tietotyyppien muuntaminen numeerisiksi arvoiksi vaatii erilaisia lähestymistapoja, joten ne on käsiteltävä erikseen.

Note
Lisätietoa

Päivämäärien muuntamiseen numeerisiksi arvoiksi on olemassa parempia tapoja, jotka eivät kuulu tämän johdantokurssin piiriin. Esimerkiksi, jos käytämme vain 'month'-ominaisuutta, se ei huomioi sitä, että 12. kuukausi on todellisuudessa lähempänä 1. kuin 9. kuukautta.

question-icon

Yhdistä ominaisuus ja sen tietotyyppi.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Klikkaa tai vedä ja pudota esineitä ja täytä tyhjät kohdat

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 4
some-alt