Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Selección de Características vs. Extracción de Características | Introducción a la Reducción de Dimensionalidad
Reducción de Dimensionalidad con PCA

bookSelección de Características vs. Extracción de Características

Los conjuntos de datos de alta dimensión a menudo tienen más características de las necesarias. Puede reducir las características utilizando dos estrategias principales: selección de características y extracción de características.

  • Selección de características implica conservar solo las características originales más importantes, como elegir sus frutas favoritas de una canasta;
  • Extracción de características crea nuevas características combinando o transformando las originales, como mezclar todas las frutas en un batido.

El Análisis de Componentes Principales (PCA) es un método común de extracción de características, que explorará en detalle más adelante.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Nota

PCA es una técnica poderosa de extracción de características que crea nuevas características (componentes principales) a partir de sus datos originales. Los detalles sobre cómo funciona PCA se tratarán en los próximos capítulos.

Reducir el número de características puede ayudar a identificar patrones que podrían estar ocultos en dimensiones superiores. Mediante la visualización, es posible graficar características seleccionadas para revelar agrupaciones o tendencias de manera más clara. Por ejemplo, graficar solo las características más relevantes con seaborn puede resaltar relaciones en los datos, facilitando su interpretación y análisis.

question mark

¿Cuál afirmación describe mejor la diferencia entre selección de características y extracción de características en la reducción de dimensionalidad?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 3

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 8.33

bookSelección de Características vs. Extracción de Características

Desliza para mostrar el menú

Los conjuntos de datos de alta dimensión a menudo tienen más características de las necesarias. Puede reducir las características utilizando dos estrategias principales: selección de características y extracción de características.

  • Selección de características implica conservar solo las características originales más importantes, como elegir sus frutas favoritas de una canasta;
  • Extracción de características crea nuevas características combinando o transformando las originales, como mezclar todas las frutas en un batido.

El Análisis de Componentes Principales (PCA) es un método común de extracción de características, que explorará en detalle más adelante.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Nota

PCA es una técnica poderosa de extracción de características que crea nuevas características (componentes principales) a partir de sus datos originales. Los detalles sobre cómo funciona PCA se tratarán en los próximos capítulos.

Reducir el número de características puede ayudar a identificar patrones que podrían estar ocultos en dimensiones superiores. Mediante la visualización, es posible graficar características seleccionadas para revelar agrupaciones o tendencias de manera más clara. Por ejemplo, graficar solo las características más relevantes con seaborn puede resaltar relaciones en los datos, facilitando su interpretación y análisis.

question mark

¿Cuál afirmación describe mejor la diferencia entre selección de características y extracción de características en la reducción de dimensionalidad?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 3
some-alt