Typen Gegevens
Elke kolom (feature) in een trainingsset heeft een bijbehorend gegevenstype. Deze gegevenstypen kunnen worden gegroepeerd in numeriek, categorisch en datum en(of) tijd.
De meeste ML-algoritmen presteren alleen goed met numerieke gegevens, dus categorische en datum/tijd-waarden moeten worden omgezet naar getallen.
Voor datum en tijd kunnen kenmerken zoals 'year', 'month' en vergelijkbare worden geëxtraheerd, afhankelijk van de taak. Dit zijn al numerieke waarden, dus deze kunnen direct worden gebruikt.
Categorische gegevens zijn iets lastiger om mee om te gaan.
Typen categorische gegevens
Categorische gegevens worden onderverdeeld in twee typen:
-
Ordinale gegevens zijn een type categorische gegevens waarbij de categorieën een natuurlijke volgorde hebben. Bijvoorbeeld, opleidingsniveau (van basisschool tot Ph.D.) of beoordelingen (van zeer slecht tot zeer goed), enzovoort;
-
Nominale gegevens zijn een type categorische gegevens zonder natuurlijke volgorde. Bijvoorbeeld, naam, geslacht, land van herkomst, enzovoort.
Het omzetten van ordinale en nominale gegevenstypen naar numerieke waarden vereist verschillende benaderingen, dus ze moeten afzonderlijk worden behandeld.
Er zijn betere methoden om datums om te zetten naar numerieke waarden die buiten de scope van deze inleidende cursus vallen. Bijvoorbeeld, als alleen de 'month'-eigenschap wordt gebruikt, wordt niet meegenomen dat de 12e maand eigenlijk dichter bij de 1e ligt dan bij de 9e.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Typen Gegevens
Veeg om het menu te tonen
Elke kolom (feature) in een trainingsset heeft een bijbehorend gegevenstype. Deze gegevenstypen kunnen worden gegroepeerd in numeriek, categorisch en datum en(of) tijd.
De meeste ML-algoritmen presteren alleen goed met numerieke gegevens, dus categorische en datum/tijd-waarden moeten worden omgezet naar getallen.
Voor datum en tijd kunnen kenmerken zoals 'year', 'month' en vergelijkbare worden geëxtraheerd, afhankelijk van de taak. Dit zijn al numerieke waarden, dus deze kunnen direct worden gebruikt.
Categorische gegevens zijn iets lastiger om mee om te gaan.
Typen categorische gegevens
Categorische gegevens worden onderverdeeld in twee typen:
-
Ordinale gegevens zijn een type categorische gegevens waarbij de categorieën een natuurlijke volgorde hebben. Bijvoorbeeld, opleidingsniveau (van basisschool tot Ph.D.) of beoordelingen (van zeer slecht tot zeer goed), enzovoort;
-
Nominale gegevens zijn een type categorische gegevens zonder natuurlijke volgorde. Bijvoorbeeld, naam, geslacht, land van herkomst, enzovoort.
Het omzetten van ordinale en nominale gegevenstypen naar numerieke waarden vereist verschillende benaderingen, dus ze moeten afzonderlijk worden behandeld.
Er zijn betere methoden om datums om te zetten naar numerieke waarden die buiten de scope van deze inleidende cursus vallen. Bijvoorbeeld, als alleen de 'month'-eigenschap wordt gebruikt, wordt niet meegenomen dat de 12e maand eigenlijk dichter bij de 1e ligt dan bij de 9e.
Bedankt voor je feedback!