Contenu du cours
Introduction à TensorFlow
Introduction à TensorFlow
Applications des Tenseurs
Applications des Tenseurs
Les tenseurs, avec leur nature multidimensionnelle, trouvent des applications dans une gamme diversifiée de tâches de données. Leur structure et leur forme sont essentielles pour déterminer comment ils représentent et traitent les données dans divers scénarios. Explorons :
- Données de Table : Souvent représentées dans des tenseurs 2D, les données de table rappellent les matrices. Chaque ligne peut représenter une entrée de données, et chaque colonne pourrait signifier une caractéristique ou un attribut des données. Par exemple, un ensemble de données avec 1000 échantillons et 10 caractéristiques serait encapsulé dans un tenseur de forme
(1000, 10)
;
- Séquences de texte : Les séquences, telles qu'une série temporelle ou des données textuelles, sont généralement mappées à des tenseurs 2D. Une dimension séquence à travers le temps ou la longueur, tandis que l'autre indique les caractéristiques à chaque étape temporelle. Un texte de
200
mots traité avec des embeddings de taille50
se traduirait par un tenseur de(200, 50)
;Remarque
Les embeddings dans le traitement du texte sont un moyen de convertir les mots en vecteurs numériques, de sorte que les mots ayant des significations similaires aient des valeurs de vecteur similaires. Cela permet aux ordinateurs de mieux comprendre et travailler avec les données textuelles en capturant les relations sémantiques entre les mots. Dans cet exemple, chaque mot sera converti en un vecteur d'une longueur de
50
, ce qui signifie que chaque mot sera représenté par50
nombres à virgule flottante.
- Séquences numériques : Dans des scénarios tels que la surveillance de plusieurs paramètres système au fil du temps, des tenseurs 2D peuvent être utilisés. Considérons un système de contrôle où vous observez le comportement de
5
paramètres différents (par exemple, température, pression, humidité, tension et courant) sur une période de10
heures. Chaque paramètre a40
points de données enregistrés chaque heure. Sur10
heures, cela s'agrège à une forme de tenseur de(400, 5)
. Dans ce format, la première dimension suit séquentiellement la chronologie (avec40
points de données pour chacune des10
heures, totalisant400
), tandis que la deuxième dimension détaille les données pour chacun des5
paramètres à chaque point de données;
-
Traitement d'image : Les images sont principalement représentées sous forme de tenseurs 3D. La hauteur et la largeur de l'image créent les deux premières dimensions, tandis que la profondeur (canaux de couleur comme RGB) forme la troisième. Une image colorée de
256x256
pixels aurait une forme de tenseur de(256, 256, 3)
;Remarque
La dernière dimension a une longueur de 3 puisque chaque pixel dans la palette de couleurs RGB est représenté par trois valeurs distinctes, correspondant à ses canaux de couleur : Rouge, Vert et Bleu.
- Traitement Vidéo: Les vidéos, étant des séquences d'images, sont exprimées à l'aide de tenseurs 4D. Pensez à chaque image comme une image. Ainsi, une vidéo de
60
secondes, échantillonnée à1
image par seconde, avec chaque image étant une image colorée de256x256
, serait représentée comme un tenseur de(60, 256, 256, 3)
.
Remarque
Pour une vidéo avec
30
images chaque seconde, nous aurions30 * nombre de secondes
images au total. Donc, pour60
secondes, cela fait30
images/seconde multipliées par60
secondes, nous donnant1800
images. Cela entraînerait une forme de tenseur de(1800, 256, 256, 3)
.
Comprendre ces formes et la logique qui les sous-tend est fondamental. En garantissant les bonnes dimensions de tenseur, nous alignons les données correctement, posant ainsi les bases pour un entraînement et une inférence de modèle efficaces.
1. Vous avez un tableau de dossiers de patients avec 500 patients. Chaque dossier a 8 caractéristiques comme l'âge, le groupe sanguin, la taille et le poids. Quelle est la forme du tenseur qui représente ces données ?
2. Un roman est traité mot par mot, et il contient 1000 mots au total. Si chaque mot est représenté par des embeddings de taille 20, quelle forme de tenseur encapsule ces données ?
3. Un système de surveillance environnementale capture des données de 4 métriques différentes (comme le niveau de CO2, la température, l'humidité et la pression atmosphérique) sur 12 heures. Si chaque heure contient 30 points de données pour chaque métrique, quelle serait la forme du tenseur ?
4. Vous avez un ensemble de données de 200 images en niveaux de gris pour un projet d'apprentissage automatique. Chaque image est de 128x128
pixels. Les images en niveaux de gris n'ont qu'un seul canal. Quelle est la forme du tenseur représentant ces données ?
Merci pour vos commentaires !