Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Implementación en un Conjunto de Datos Ficticio | Clustering Jerárquico
Análisis de Conglomerados con Python

Implementación en un Conjunto de Datos Ficticio

Desliza para mostrar el menú

Como es habitual, utilizarás las siguientes bibliotecas:

  • sklearn para generar datos ficticios e implementar el clustering jerárquico (AgglomerativeClustering);

  • scipy para generar y trabajar con el dendrograma;

  • matplotlib para visualizar los clústeres y el dendrograma;

  • numpy para operaciones numéricas.

Generación de datos ficticios

Puedes utilizar la función make_blobs() de scikit-learn para generar conjuntos de datos con diferentes cantidades de clústeres y distintos grados de separación. Esto te permitirá observar cómo se comporta el clustering jerárquico en diferentes escenarios.

Datos ficticios

El algoritmo general es el siguiente:

  1. Instanciación del objeto AgglomerativeClustering, especificando el método de enlace y otros parámetros;

  2. Ajuste del modelo a los datos;

  3. Extracción de etiquetas de clúster si se decide un número específico de clústeres;

  4. Visualización de los clústeres (si los datos son 2D o 3D) utilizando gráficos de dispersión;

  5. Uso de linkage de SciPy para crear la matriz de enlace y luego dendrogram para visualizar el dendrograma.

También es posible experimentar con diferentes métodos de enlace (por ejemplo, single, complete, average, Ward's) y observar cómo afectan los resultados del agrupamiento y la estructura del dendrograma.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 3

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 4. Capítulo 3
some-alt