Types de Données
Chaque colonne (caractéristique) d'un ensemble d'entraînement possède un type de données qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriels et date et/ou heure.
La plupart des algorithmes d'apprentissage automatique fonctionnent efficacement uniquement avec des données numériques, il est donc nécessaire de convertir les valeurs catégorielles et de type date/heure en nombres.
Pour les dates et heures, il est possible d'extraire des caractéristiques telles que 'year', 'month' et similaires, selon la tâche. Celles-ci sont déjà des valeurs numériques, elles peuvent donc être utilisées directement.
Les données catégorielles sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
La conversion des types de données ordinales et nominales en valeurs numériques nécessite des approches différentes, elles doivent donc être traitées séparément.
Il existe de meilleures méthodes pour convertir les dates en valeurs numériques, qui dépassent le cadre de ce cours d'introduction. Par exemple, si l'on utilise uniquement la caractéristique 'month', cela ne prend pas en compte que le 12e mois est en réalité plus proche du 1er que du 9e.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain how to convert ordinal data into numerical values?
What are the common methods for encoding nominal data?
Why do machine learning algorithms require numerical data?
Awesome!
Completion rate improved to 3.13
Types de Données
Glissez pour afficher le menu
Chaque colonne (caractéristique) d'un ensemble d'entraînement possède un type de données qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriels et date et/ou heure.
La plupart des algorithmes d'apprentissage automatique fonctionnent efficacement uniquement avec des données numériques, il est donc nécessaire de convertir les valeurs catégorielles et de type date/heure en nombres.
Pour les dates et heures, il est possible d'extraire des caractéristiques telles que 'year', 'month' et similaires, selon la tâche. Celles-ci sont déjà des valeurs numériques, elles peuvent donc être utilisées directement.
Les données catégorielles sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
La conversion des types de données ordinales et nominales en valeurs numériques nécessite des approches différentes, elles doivent donc être traitées séparément.
Il existe de meilleures méthodes pour convertir les dates en valeurs numériques, qui dépassent le cadre de ce cours d'introduction. Par exemple, si l'on utilise uniquement la caractéristique 'month', cela ne prend pas en compte que le 12e mois est en réalité plus proche du 1er que du 9e.
Merci pour vos commentaires !