Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Hochdimensionale Daten und der Fluch der Dimensionalität | Einführung in die Dimensionsreduktion
Dimensionsreduktion mit PCA

bookHochdimensionale Daten und der Fluch der Dimensionalität

Hochdimensionale Daten besitzen viele Merkmale oder Spalten. Mit jeder zusätzlichen Dimension entfernen sich die Datenpunkte weiter voneinander, und der Raum wird zunehmend leerer. Dadurch wird es schwierig, Muster zu erkennen, da die Abstände zwischen den Punkten an Aussagekraft verlieren. Dies wird als Fluch der Dimensionalität bezeichnet – die Herausforderung, Daten zu analysieren, wenn zu viele Merkmale vorhanden sind.

1234567891011121314151617181920212223242526272829
import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
copy
question mark

Welche Aussage beschreibt den Fluch der Dimensionalität im Zusammenhang mit hochdimensionalen Datensätzen am besten?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 2

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 8.33

bookHochdimensionale Daten und der Fluch der Dimensionalität

Swipe um das Menü anzuzeigen

Hochdimensionale Daten besitzen viele Merkmale oder Spalten. Mit jeder zusätzlichen Dimension entfernen sich die Datenpunkte weiter voneinander, und der Raum wird zunehmend leerer. Dadurch wird es schwierig, Muster zu erkennen, da die Abstände zwischen den Punkten an Aussagekraft verlieren. Dies wird als Fluch der Dimensionalität bezeichnet – die Herausforderung, Daten zu analysieren, wenn zu viele Merkmale vorhanden sind.

1234567891011121314151617181920212223242526272829
import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
copy
question mark

Welche Aussage beschreibt den Fluch der Dimensionalität im Zusammenhang mit hochdimensionalen Datensätzen am besten?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 2
some-alt