Types de Données
Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de données qui lui est associé. Ces types de données peuvent être regroupés en numérique, catégoriel et date et/ou heure.
La plupart des algorithmes d'apprentissage automatique fonctionnent bien uniquement avec des données numériques, il est donc nécessaire de convertir les valeurs catégorielles et de type date/heure en nombres.
Pour les dates et heures, des caractéristiques telles que 'year', 'month' et similaires peuvent être extraites, selon la tâche. Celles-ci sont déjà des valeurs numériques, elles peuvent donc être utilisées directement.
Les données catégorielles sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
La conversion des types de données ordinales et nominales en valeurs numériques nécessite des approches différentes, elles doivent donc être traitées séparément.
Il existe de meilleures méthodes pour convertir les dates en valeurs numériques, qui dépassent le cadre de ce cours d'introduction. Par exemple, si l'on utilise uniquement la caractéristique 'month', cela ne prend pas en compte que le 12e mois est en réalité plus proche du 1er que du 9e.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 4.55
Types de Données
Glissez pour afficher le menu
Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de données qui lui est associé. Ces types de données peuvent être regroupés en numérique, catégoriel et date et/ou heure.
La plupart des algorithmes d'apprentissage automatique fonctionnent bien uniquement avec des données numériques, il est donc nécessaire de convertir les valeurs catégorielles et de type date/heure en nombres.
Pour les dates et heures, des caractéristiques telles que 'year', 'month' et similaires peuvent être extraites, selon la tâche. Celles-ci sont déjà des valeurs numériques, elles peuvent donc être utilisées directement.
Les données catégorielles sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
La conversion des types de données ordinales et nominales en valeurs numériques nécessite des approches différentes, elles doivent donc être traitées séparément.
Il existe de meilleures méthodes pour convertir les dates en valeurs numériques, qui dépassent le cadre de ce cours d'introduction. Par exemple, si l'on utilise uniquement la caractéristique 'month', cela ne prend pas en compte que le 12e mois est en réalité plus proche du 1er que du 9e.
Merci pour vos commentaires !