Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Høydimensjonale Data og Dimensjonalitetsforbannelsen | Introduksjon til Dimensjonsreduksjon
Dimensjonsreduksjon med PCA

bookHøydimensjonale Data og Dimensjonalitetsforbannelsen

Data med høy dimensjonalitet har mange egenskaper, eller kolonner. Når du legger til flere dimensjoner, sprer datapunktene seg lenger fra hverandre, og rommet blir stadig tommere. Dette gjør det vanskelig å finne mønstre, fordi avstandene mellom punktene mister sin betydning. Dette kalles dimensjonalitetsforbannelsen—utfordringen med å analysere data når det er for mange egenskaper.

1234567891011121314151617181920212223242526272829
import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
copy
question mark

Hvilket utsagn beskriver best dimensjonalitetsforbannelsen i sammenheng med datasett med høy dimensjonalitet

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 2

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 8.33

bookHøydimensjonale Data og Dimensjonalitetsforbannelsen

Sveip for å vise menyen

Data med høy dimensjonalitet har mange egenskaper, eller kolonner. Når du legger til flere dimensjoner, sprer datapunktene seg lenger fra hverandre, og rommet blir stadig tommere. Dette gjør det vanskelig å finne mønstre, fordi avstandene mellom punktene mister sin betydning. Dette kalles dimensjonalitetsforbannelsen—utfordringen med å analysere data når det er for mange egenskaper.

1234567891011121314151617181920212223242526272829
import numpy as np import matplotlib.pyplot as plt # Generate random points in 2D np.random.seed(0) points_2d = np.random.rand(100, 2) # Generate random points in 3D points_3d = np.random.rand(100, 3) fig = plt.figure(figsize=(12, 5)) # Plot 2D points ax1 = fig.add_subplot(1, 2, 1) ax1.scatter(points_2d[:, 0], points_2d[:, 1], color='blue', alpha=0.6) ax1.set_title('100 Random Points in 2D') ax1.set_xlabel('X') ax1.set_ylabel('Y') # Plot 3D points ax2 = fig.add_subplot(1, 2, 2, projection='3d') ax2.scatter(points_3d[:, 0], points_3d[:, 1], points_3d[:, 2], color='red', alpha=0.6) ax2.set_title('100 Random Points in 3D') ax2.set_xlabel('X') ax2.set_ylabel('Y') ax2.set_zlabel('Z') plt.tight_layout() plt.show()
copy
question mark

Hvilket utsagn beskriver best dimensjonalitetsforbannelsen i sammenheng med datasett med høy dimensjonalitet

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 2
some-alt