Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Types de Données | Concepts de l'Apprentissage Automatique
Introduction au ML Avec Scikit-Learn

bookTypes de Données

Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de donnée qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriques et date et/ou heure.

Malheureusement, la plupart des algorithmes de ML ne fonctionnent bien qu'avec des nombres. Il est donc nécessaire de convertir les données catégorielles ainsi que les données de type date et heure en nombres.

Concernant les dates et heures, il est possible d'utiliser des caractéristiques telles que 'year', 'month', etc., selon la tâche à accomplir. Ces caractéristiques sont des valeurs numériques, il n'y a donc aucun problème à ce sujet.

Les données catégorielles sont un peu plus complexes à traiter.

Types de données catégorielles

Les données catégorielles sont classées en deux types :

  • Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;

  • Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.

Comme vous le verrez dans les chapitres suivants, la conversion des types de données ordinales et nominales en valeurs numériques diffère, c'est pourquoi il est nécessaire de les distinguer.

question-icon

Associer la caractéristique à son type de données.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 4

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 3.13

bookTypes de Données

Glissez pour afficher le menu

Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de donnée qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriques et date et/ou heure.

Malheureusement, la plupart des algorithmes de ML ne fonctionnent bien qu'avec des nombres. Il est donc nécessaire de convertir les données catégorielles ainsi que les données de type date et heure en nombres.

Concernant les dates et heures, il est possible d'utiliser des caractéristiques telles que 'year', 'month', etc., selon la tâche à accomplir. Ces caractéristiques sont des valeurs numériques, il n'y a donc aucun problème à ce sujet.

Les données catégorielles sont un peu plus complexes à traiter.

Types de données catégorielles

Les données catégorielles sont classées en deux types :

  • Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;

  • Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.

Comme vous le verrez dans les chapitres suivants, la conversion des types de données ordinales et nominales en valeurs numériques diffère, c'est pourquoi il est nécessaire de les distinguer.

question-icon

Associer la caractéristique à son type de données.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 4
some-alt