Glissez pour afficher le menu

Applications des tenseurs

Les tenseurs, grâce à leur nature multidimensionnelle, trouvent des applications dans une large gamme de tâches de données. Leur structure et leur forme sont essentielles pour déterminer comment ils représentent et traitent les données dans divers contextes. Examinons :

Données tabulaires : souvent représentées par des tenseurs 2D, les données tabulaires rappellent les matrices. Chaque ligne peut représenter une entrée de données, et chaque colonne peut indiquer une caractéristique ou un attribut des données. Par exemple, un ensemble de données avec 1000 échantillons et 10 caractéristiques serait encapsulé dans un tenseur de forme (1000, 10) ;

Séquences textuelles : les séquences, telles qu’une série temporelle ou des données textuelles, sont généralement mappées à des tenseurs 2D. Une dimension parcourt le temps ou la longueur, tandis que l’autre indique les caractéristiques à chaque étape temporelle. Un texte de 200 mots traité avec des embeddings de taille 50 se traduit par un tenseur de forme (200, 50) ;

Note

Les embeddings en traitement de texte sont une méthode permettant de convertir les mots en vecteurs numériques, de sorte que les mots ayant des significations similaires possèdent des valeurs de vecteur similaires. Cela permet aux ordinateurs de mieux comprendre et manipuler les données textuelles en capturant les relations sémantiques entre les mots. Dans cet exemple, chaque mot sera converti en un vecteur de longueur 50, ce qui signifie que chaque mot sera représenté par 50 nombres à virgule flottante.

Suites numériques : dans des scénarios tels que la surveillance de plusieurs paramètres système au fil du temps, des tenseurs 2D peuvent être utilisés. Considérer un système de contrôle où l’on observe le comportement de 5 paramètres différents (par exemple, température, pression, humidité, tension et courant) sur une période de 10 heures. Chaque paramètre possède 40 points de données enregistrés chaque heure. Sur 10 heures, cela donne une forme de tenseur de (400, 5). Dans ce format, la première dimension suit séquentiellement la chronologie (avec 40 points de données pour chacune des 10 heures, soit un total de 400), tandis que la seconde dimension détaille les données pour chacun des 5 paramètres à chaque point de données ;

Traitement d’images : les images sont principalement représentées sous forme de tenseurs 3D. La hauteur et la largeur de l’image constituent les deux premières dimensions, tandis que la profondeur (canaux de couleur comme RGB) forme la troisième. Une image en couleur de 256x256 pixels aura une forme de tenseur de (256, 256, 3) ;

Remarque

La dernière dimension a une longueur de 3 car chaque pixel dans la palette de couleurs RGB est représenté par trois valeurs distinctes, correspondant à ses canaux de couleur : Rouge, Vert et Bleu.

Traitement vidéo : les vidéos, en tant que séquences d'images, sont représentées à l'aide de tenseurs 4D. Considérer chaque image comme une image individuelle. Ainsi, une vidéo de 60 secondes, échantillonnée à 1 image par seconde, avec chaque image de taille 256x256 en couleur, serait représentée par un tenseur de forme (60, 256, 256, 3).

Remarque

Pour une vidéo avec 30 images par seconde, il y aurait un total de 30 * number of seconds images. Ainsi, pour 60 secondes, cela donne 30 images/seconde multipliées par 60 secondes, soit 1800 images. Cela se traduirait par une forme de tenseur de (1800, 256, 256, 3).

Comprendre ces formes et la logique qui les sous-tend est fondamental. En garantissant les bonnes dimensions des tenseurs, les données sont correctement alignées, posant ainsi les bases d'un entraînement et d'une inférence de modèle efficaces.

1. Vous disposez d'une table de dossiers de patients comprenant 500 patients. Chaque dossier comporte 8 caractéristiques telles que l'âge, le groupe sanguin, la taille et le poids. Quelle est la forme du tenseur qui représente ces données ?

2. Un roman est traité mot par mot et contient au total 1000 mots. Si chaque mot est représenté par des embeddings de taille 20, quelle forme de tenseur encapsule ces données ?

3. Un système de surveillance environnementale capture les données de 4 métriques différentes (telles que le niveau de CO2, la température, l'humidité et la pression atmosphérique) sur 12 heures. Si chaque heure contient 30 points de données pour chaque métrique, quelle serait la forme du tenseur ?

4. Vous disposez d'un ensemble de données de 200 images en niveaux de gris pour un projet d'apprentissage automatique. Chaque image mesure `128x128` pixels. Les images en niveaux de gris n'ont qu'un seul canal. Quelle est la forme du tenseur représentant ces données ?

Tout était clair ?

Merci pour vos commentaires !

Section 1. Chapitre 4

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 1. Chapitre 4

Applications des Tenseurs

Applications des tenseurs

1. Vous disposez d'une table de dossiers de patients comprenant 500 patients. Chaque dossier comporte 8 caractéristiques telles que l'âge, le groupe sanguin, la taille et le poids. Quelle est la forme du tenseur qui représente ces données ?

2. Un roman est traité mot par mot et contient au total 1000 mots. Si chaque mot est représenté par des embeddings de taille 20, quelle forme de tenseur encapsule ces données ?

4. Vous disposez d'un ensemble de données de 200 images en niveaux de gris pour un projet d'apprentissage automatique. Chaque image mesure 128x128 pixels. Les images en niveaux de gris n'ont qu'un seul canal. Quelle est la forme du tenseur représentant ces données ?

4. Vous disposez d'un ensemble de données de 200 images en niveaux de gris pour un projet d'apprentissage automatique. Chaque image mesure `128x128` pixels. Les images en niveaux de gris n'ont qu'un seul canal. Quelle est la forme du tenseur représentant ces données ?