Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Données à Haute Dimensionnalité et Malédiction de la Dimensionnalité | Introduction à la Réduction de Dimensionnalité
Réduction de Dimensionnalité avec l'ACP

bookDonnées à Haute Dimensionnalité et Malédiction de la Dimensionnalité

Les données à haute dimension possèdent de nombreuses caractéristiques ou colonnes. Lorsque l’on ajoute davantage de dimensions, les points de données s’éloignent les uns des autres et l’espace devient de plus en plus vide. Cela complique la détection de motifs, car les distances entre les points perdent de leur signification. Ce phénomène est appelé la malédiction de la dimensionnalité—la difficulté d’analyser des données comportant trop de caractéristiques.

1234567891011121314151617181920212223242526272829
import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
copy
question mark

Quelle affirmation décrit le mieux la malédiction de la dimensionnalité dans le contexte des ensembles de données à haute dimension ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain more about why distances lose meaning in high dimensions?

What are some ways to deal with the curse of dimensionality?

Can you give real-world examples where the curse of dimensionality is a problem?

Awesome!

Completion rate improved to 8.33

bookDonnées à Haute Dimensionnalité et Malédiction de la Dimensionnalité

Glissez pour afficher le menu

Les données à haute dimension possèdent de nombreuses caractéristiques ou colonnes. Lorsque l’on ajoute davantage de dimensions, les points de données s’éloignent les uns des autres et l’espace devient de plus en plus vide. Cela complique la détection de motifs, car les distances entre les points perdent de leur signification. Ce phénomène est appelé la malédiction de la dimensionnalité—la difficulté d’analyser des données comportant trop de caractéristiques.

1234567891011121314151617181920212223242526272829
import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
copy
question mark

Quelle affirmation décrit le mieux la malédiction de la dimensionnalité dans le contexte des ensembles de données à haute dimension ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 2
some-alt