Types de Données
Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de donnée qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriques et date et/ou heure.
Malheureusement, la plupart des algorithmes de ML ne fonctionnent bien qu'avec des nombres. Il est donc nécessaire de convertir les données catégorielles ainsi que les données de type date et heure en nombres.
Concernant les dates et heures, il est possible d'utiliser des caractéristiques telles que 'year'
, 'month'
, etc., selon la tâche à accomplir. Ces caractéristiques sont des valeurs numériques, il n'y a donc aucun problème à ce sujet.
Les données catégorielles sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
Comme vous le verrez dans les chapitres suivants, la conversion des types de données ordinales et nominales en valeurs numériques diffère, c'est pourquoi il est nécessaire de les distinguer.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.13
Types de Données
Glissez pour afficher le menu
Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de donnée qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriques et date et/ou heure.
Malheureusement, la plupart des algorithmes de ML ne fonctionnent bien qu'avec des nombres. Il est donc nécessaire de convertir les données catégorielles ainsi que les données de type date et heure en nombres.
Concernant les dates et heures, il est possible d'utiliser des caractéristiques telles que 'year'
, 'month'
, etc., selon la tâche à accomplir. Ces caractéristiques sont des valeurs numériques, il n'y a donc aucun problème à ce sujet.
Les données catégorielles sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
Comme vous le verrez dans les chapitres suivants, la conversion des types de données ordinales et nominales en valeurs numériques diffère, c'est pourquoi il est nécessaire de les distinguer.
Merci pour vos commentaires !