Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Implementación en Conjunto de Datos Ficticio | DBSCAN
Análisis de Conglomerados

bookImplementación en Conjunto de Datos Ficticio

Crearás dos conjuntos de datos para demostrar las fortalezas de DBSCAN:

  • Moons: dos semicírculos entrelazados;

  • Circles: un círculo pequeño dentro de un círculo más grande.

El algoritmo es el siguiente:

  1. Instanciar el objeto DBSCAN, configurando eps y min_samples;

  2. Ajustar el modelo a tus datos;

  3. Visualizar los resultados graficando los puntos de datos y coloreándolos según sus etiquetas de clúster asignadas.

Ajuste de hiperparámetros

La elección de eps y min_samples impacta significativamente en el resultado del agrupamiento. Experimenta con diferentes valores para encontrar los que mejor se adapten a tus datos. Por ejemplo, si eps es demasiado grande, todos los puntos podrían terminar en un solo clúster. Si eps es demasiado pequeño, muchos puntos podrían clasificarse como ruido. También puedes escalar las características.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 4

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 2.94

bookImplementación en Conjunto de Datos Ficticio

Desliza para mostrar el menú

Crearás dos conjuntos de datos para demostrar las fortalezas de DBSCAN:

  • Moons: dos semicírculos entrelazados;

  • Circles: un círculo pequeño dentro de un círculo más grande.

El algoritmo es el siguiente:

  1. Instanciar el objeto DBSCAN, configurando eps y min_samples;

  2. Ajustar el modelo a tus datos;

  3. Visualizar los resultados graficando los puntos de datos y coloreándolos según sus etiquetas de clúster asignadas.

Ajuste de hiperparámetros

La elección de eps y min_samples impacta significativamente en el resultado del agrupamiento. Experimenta con diferentes valores para encontrar los que mejor se adapten a tus datos. Por ejemplo, si eps es demasiado grande, todos los puntos podrían terminar en un solo clúster. Si eps es demasiado pequeño, muchos puntos podrían clasificarse como ruido. También puedes escalar las características.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 4
some-alt