Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Typen Gegevens | Sectie
Practice
Projects
Quizzes & Challenges
Quizzen
Challenges
/
Grondslagen van Machine Learning

bookTypen Gegevens

Elke kolom (feature) in een trainingsset heeft een bijbehorend gegevenstype. Deze gegevenstypen kunnen worden gegroepeerd in numeriek, categorisch en datum en/of tijd.

De meeste ML-algoritmen presteren alleen goed met numerieke gegevens, dus categorische en datum/tijd-waarden moeten worden omgezet in getallen.

Voor datum en tijd kunnen kenmerken zoals 'year', 'month' en vergelijkbare worden geëxtraheerd, afhankelijk van de taak. Dit zijn al numerieke waarden, dus deze kunnen direct worden gebruikt.

Categorische gegevens zijn iets lastiger om mee om te gaan.

Typen van Categoriegegevens

Categoriegegevens worden onderverdeeld in twee typen:

  • Ordinale gegevens zijn een type categoriegegevens waarbij de categorieën een natuurlijke volgorde hebben. Bijvoorbeeld, opleidingsniveau (van basisschool tot Ph.D.) of beoordelingen (van zeer slecht tot zeer goed), enzovoort;

  • Nominale gegevens zijn een type categoriegegevens zonder natuurlijke volgorde. Bijvoorbeeld, naam, geslacht, land van herkomst, enzovoort.

Het omzetten van ordinale en nominale gegevenstypen naar numerieke waarden vereist verschillende benaderingen, dus ze moeten afzonderlijk worden behandeld.

Note
Meer Bestuderen

Er zijn betere methoden om datums naar numerieke waarden om te zetten die buiten de reikwijdte van deze inleidende cursus vallen. Bijvoorbeeld, als we alleen de 'month'-eigenschap gebruiken, wordt niet meegenomen dat de 12e maand eigenlijk dichter bij de 1e ligt dan bij de 9e.

question-icon

Koppel het kenmerk aan het bijbehorende gegevenstype.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 4

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

bookTypen Gegevens

Veeg om het menu te tonen

Elke kolom (feature) in een trainingsset heeft een bijbehorend gegevenstype. Deze gegevenstypen kunnen worden gegroepeerd in numeriek, categorisch en datum en/of tijd.

De meeste ML-algoritmen presteren alleen goed met numerieke gegevens, dus categorische en datum/tijd-waarden moeten worden omgezet in getallen.

Voor datum en tijd kunnen kenmerken zoals 'year', 'month' en vergelijkbare worden geëxtraheerd, afhankelijk van de taak. Dit zijn al numerieke waarden, dus deze kunnen direct worden gebruikt.

Categorische gegevens zijn iets lastiger om mee om te gaan.

Typen van Categoriegegevens

Categoriegegevens worden onderverdeeld in twee typen:

  • Ordinale gegevens zijn een type categoriegegevens waarbij de categorieën een natuurlijke volgorde hebben. Bijvoorbeeld, opleidingsniveau (van basisschool tot Ph.D.) of beoordelingen (van zeer slecht tot zeer goed), enzovoort;

  • Nominale gegevens zijn een type categoriegegevens zonder natuurlijke volgorde. Bijvoorbeeld, naam, geslacht, land van herkomst, enzovoort.

Het omzetten van ordinale en nominale gegevenstypen naar numerieke waarden vereist verschillende benaderingen, dus ze moeten afzonderlijk worden behandeld.

Note
Meer Bestuderen

Er zijn betere methoden om datums naar numerieke waarden om te zetten die buiten de reikwijdte van deze inleidende cursus vallen. Bijvoorbeeld, als we alleen de 'month'-eigenschap gebruiken, wordt niet meegenomen dat de 12e maand eigenlijk dichter bij de 1e ligt dan bij de 9e.

question-icon

Koppel het kenmerk aan het bijbehorende gegevenstype.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 4
some-alt