Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Implementación en un Conjunto de Datos Ficticio | Clustering Jerárquico
Análisis de Conglomerados

bookImplementación en un Conjunto de Datos Ficticio

Como es habitual, utilizarás las siguientes bibliotecas:

  • sklearn para generar datos ficticios e implementar el clustering jerárquico (AgglomerativeClustering);

  • scipy para generar y trabajar con el dendrograma;

  • matplotlib para visualizar los clústeres y el dendrograma;

  • numpy para operaciones numéricas.

Generación de datos ficticios

Puedes utilizar la función make_blobs() de scikit-learn para generar conjuntos de datos con diferentes cantidades de clústeres y grados variables de separación. Esto te permitirá observar cómo se comporta el clustering jerárquico en distintos escenarios.

El algoritmo general es el siguiente:

  1. Instanciar el objeto AgglomerativeClustering, especificando el método de enlace y otros parámetros;

  2. Ajustar el modelo a tus datos;

  3. Extraer etiquetas de clúster si decides un número específico de clústeres;

  4. Visualizar los clústeres (si los datos son 2D o 3D) utilizando gráficos de dispersión;

  5. Utilizar linkage de SciPy para crear la matriz de enlace y luego dendrogram para visualizar el dendrograma.

También puedes experimentar con diferentes métodos de enlace (por ejemplo, single, complete, average, Ward's) y observar cómo afectan a los resultados del clustering y a la estructura del dendrograma.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 3

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 2.94

bookImplementación en un Conjunto de Datos Ficticio

Desliza para mostrar el menú

Como es habitual, utilizarás las siguientes bibliotecas:

  • sklearn para generar datos ficticios e implementar el clustering jerárquico (AgglomerativeClustering);

  • scipy para generar y trabajar con el dendrograma;

  • matplotlib para visualizar los clústeres y el dendrograma;

  • numpy para operaciones numéricas.

Generación de datos ficticios

Puedes utilizar la función make_blobs() de scikit-learn para generar conjuntos de datos con diferentes cantidades de clústeres y grados variables de separación. Esto te permitirá observar cómo se comporta el clustering jerárquico en distintos escenarios.

El algoritmo general es el siguiente:

  1. Instanciar el objeto AgglomerativeClustering, especificando el método de enlace y otros parámetros;

  2. Ajustar el modelo a tus datos;

  3. Extraer etiquetas de clúster si decides un número específico de clústeres;

  4. Visualizar los clústeres (si los datos son 2D o 3D) utilizando gráficos de dispersión;

  5. Utilizar linkage de SciPy para crear la matriz de enlace y luego dendrogram para visualizar el dendrograma.

También puedes experimentar con diferentes métodos de enlace (por ejemplo, single, complete, average, Ward's) y observar cómo afectan a los resultados del clustering y a la estructura del dendrograma.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 3
some-alt