Lernen Hochdimensionale Daten und der Fluch der Dimensionalität

Swipe um das Menü anzuzeigen

Hochdimensionale Daten besitzen viele Merkmale oder Spalten. Mit jeder zusätzlichen Dimension entfernen sich die Datenpunkte weiter voneinander, und der Raum wird zunehmend leerer. Dadurch wird es schwierig, Muster zu erkennen, da die Abstände zwischen den Punkten an Aussagekraft verlieren. Dies wird als Fluch der Dimensionalität bezeichnet – die Herausforderung, Daten zu analysieren, wenn zu viele Merkmale vorhanden sind.


              1234567891011121314151617181920212223242526272829
            
import numpy as np
import matplotlib.pyplot as plt

# Generate random points in 2D
np.random.seed(0)
points_2d = np.random.rand(100, 2)

# Generate random points in 3D
points_3d = np.random.rand(100, 3)

fig = plt.figure(figsize=(12, 5))

# Plot 2D points
ax1 = fig.add_subplot(1, 2, 1)
ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6)
ax1.set_title('100 Random Points in 2D')
ax1.set_xlabel('X')
ax1.set_ylabel('Y')

# Plot 3D points
ax2 = fig.add_subplot(1, 2, 2, projection='3d')
ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6)
ax2.set_title('100 Random Points in 3D')
ax2.set_xlabel('X')
ax2.set_ylabel('Y')
ax2.set_zlabel('Z')

plt.tight_layout()
plt.show()

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 2

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 1. Kapitel 2