Données à Haute Dimensionnalité et Malédiction de la Dimensionnalité
Les données à haute dimension possèdent de nombreuses caractéristiques ou colonnes. Lorsque l’on ajoute davantage de dimensions, les points de données s’éloignent les uns des autres et l’espace devient de plus en plus vide. Cela complique la détection de motifs, car les distances entre les points perdent de leur signification. Ce phénomène est appelé la malédiction de la dimensionnalité—la difficulté d’analyser des données comportant trop de caractéristiques.
1234567891011121314151617181920212223242526272829import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain more about why distances lose meaning in high dimensions?
What are some ways to deal with the curse of dimensionality?
Can you give real-world examples where the curse of dimensionality is a problem?
Awesome!
Completion rate improved to 8.33
Données à Haute Dimensionnalité et Malédiction de la Dimensionnalité
Glissez pour afficher le menu
Les données à haute dimension possèdent de nombreuses caractéristiques ou colonnes. Lorsque l’on ajoute davantage de dimensions, les points de données s’éloignent les uns des autres et l’espace devient de plus en plus vide. Cela complique la détection de motifs, car les distances entre les points perdent de leur signification. Ce phénomène est appelé la malédiction de la dimensionnalité—la difficulté d’analyser des données comportant trop de caractéristiques.
1234567891011121314151617181920212223242526272829import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
Merci pour vos commentaires !