Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Visualización de Diagramas de Dispersión Categóricos | Sección
Visualización Estadística con Seaborn

bookVisualización de Diagramas de Dispersión Categóricos

En estadística, una variable categórica es una variable que puede tomar uno de un número limitado de valores posibles (por ejemplo, "Día de la semana", "Género", "País").

Un stripplot es esencialmente un diagrama de dispersión donde uno de los ejes representa una variable categórica. Visualiza la distribución de muchos valores individuales unidimensionales.

¿Por qué usar un Stripplot?

A diferencia de un histograma o un gráfico de densidad que agregan los datos, un stripplot muestra cada observación individual como un punto. Es ideal para conjuntos de datos pequeños donde se desea ver la dispersión exacta e identificar valores atípicos.

Parámetros clave para la personalización

Dado que los puntos pueden superponerse (un problema llamado "overplotting"), stripplot ofrece varias formas de hacerlos distinguibles:

  • alpha: controla la transparencia (de 0 a 1). Configurarlo en un valor bajo (por ejemplo, 0.25) ayuda a visualizar la densidad — las áreas más oscuras indican más puntos;
  • size: cambia el radio de los puntos;
  • marker: cambia la forma de los puntos (por ejemplo, 'D' para diamantes, 's' para cuadrados);
  • jitter: añade una pequeña cantidad de ruido aleatorio a la posición de los puntos para que no queden exactamente uno sobre otro (activado por defecto).

Ejemplo en vivo

A continuación se muestra cómo crear un stripplot que utiliza la transparencia para manejar datos superpuestos.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tarea

Swipe to start coding

Visualización de la distribución de cuentas por día con un estilo personalizado.

  1. Configuración del estilo en 'whitegrid'. Uso de un diccionario para establecer el color de fondo ('axes.facecolor') en 'aliceblue'.
  2. Creación de un stripplot utilizando el conjunto de datos tips (df):
  • Asignación de 'day' al eje x y 'total_bill' al eje y.
  • Colorear los puntos según el estado de 'smoker' mediante hue.
  • Establecimiento del size de los puntos en 20.
  • Uso de la paleta 'crest'.
  • Cambio de la forma del marcador a diamantes mediante marker='D'.
  • Ajuste de la transparencia alpha a 0.25.
  1. Visualización del gráfico.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 9
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

bookVisualización de Diagramas de Dispersión Categóricos

Desliza para mostrar el menú

En estadística, una variable categórica es una variable que puede tomar uno de un número limitado de valores posibles (por ejemplo, "Día de la semana", "Género", "País").

Un stripplot es esencialmente un diagrama de dispersión donde uno de los ejes representa una variable categórica. Visualiza la distribución de muchos valores individuales unidimensionales.

¿Por qué usar un Stripplot?

A diferencia de un histograma o un gráfico de densidad que agregan los datos, un stripplot muestra cada observación individual como un punto. Es ideal para conjuntos de datos pequeños donde se desea ver la dispersión exacta e identificar valores atípicos.

Parámetros clave para la personalización

Dado que los puntos pueden superponerse (un problema llamado "overplotting"), stripplot ofrece varias formas de hacerlos distinguibles:

  • alpha: controla la transparencia (de 0 a 1). Configurarlo en un valor bajo (por ejemplo, 0.25) ayuda a visualizar la densidad — las áreas más oscuras indican más puntos;
  • size: cambia el radio de los puntos;
  • marker: cambia la forma de los puntos (por ejemplo, 'D' para diamantes, 's' para cuadrados);
  • jitter: añade una pequeña cantidad de ruido aleatorio a la posición de los puntos para que no queden exactamente uno sobre otro (activado por defecto).

Ejemplo en vivo

A continuación se muestra cómo crear un stripplot que utiliza la transparencia para manejar datos superpuestos.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tarea

Swipe to start coding

Visualización de la distribución de cuentas por día con un estilo personalizado.

  1. Configuración del estilo en 'whitegrid'. Uso de un diccionario para establecer el color de fondo ('axes.facecolor') en 'aliceblue'.
  2. Creación de un stripplot utilizando el conjunto de datos tips (df):
  • Asignación de 'day' al eje x y 'total_bill' al eje y.
  • Colorear los puntos según el estado de 'smoker' mediante hue.
  • Establecimiento del size de los puntos en 20.
  • Uso de la paleta 'crest'.
  • Cambio de la forma del marcador a diamantes mediante marker='D'.
  • Ajuste de la transparencia alpha a 0.25.
  1. Visualización del gráfico.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 9
single

single

some-alt