Visualización de Diagramas de Dispersión Categóricos
En estadística, una variable categórica es una variable que puede tomar uno de un número limitado de valores posibles (por ejemplo, "Día de la semana", "Género", "País").
Un stripplot es esencialmente un diagrama de dispersión donde uno de los ejes representa una variable categórica. Visualiza la distribución de muchos valores individuales unidimensionales.
¿Por qué usar un Stripplot?
A diferencia de un histograma o un gráfico de densidad que agregan los datos, un stripplot muestra cada observación individual como un punto. Es ideal para conjuntos de datos pequeños donde se desea ver la dispersión exacta e identificar valores atípicos.
Parámetros clave para la personalización
Dado que los puntos pueden superponerse (un problema llamado "overplotting"), stripplot ofrece varias formas de hacerlos distinguibles:
alpha: controla la transparencia (de 0 a 1). Configurarlo en un valor bajo (por ejemplo,0.25) ayuda a visualizar la densidad — las áreas más oscuras indican más puntos;size: cambia el radio de los puntos;marker: cambia la forma de los puntos (por ejemplo,'D'para diamantes,'s'para cuadrados);jitter: añade una pequeña cantidad de ruido aleatorio a la posición de los puntos para que no queden exactamente uno sobre otro (activado por defecto).
Ejemplo en vivo
A continuación se muestra cómo crear un stripplot que utiliza la transparencia para manejar datos superpuestos.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualización de la distribución de cuentas por día con un estilo personalizado.
- Configuración del estilo en
'whitegrid'. Uso de un diccionario para establecer el color de fondo ('axes.facecolor') en'aliceblue'. - Creación de un stripplot utilizando el conjunto de datos
tips(df):
- Asignación de
'day'al ejexy'total_bill'al ejey. - Colorear los puntos según el estado de
'smoker'mediantehue. - Establecimiento del
sizede los puntos en20. - Uso de la paleta
'crest'. - Cambio de la forma del marcador a diamantes mediante
marker='D'. - Ajuste de la transparencia
alphaa0.25.
- Visualización del gráfico.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Genial!
Completion tasa mejorada a 4.55
Visualización de Diagramas de Dispersión Categóricos
Desliza para mostrar el menú
En estadística, una variable categórica es una variable que puede tomar uno de un número limitado de valores posibles (por ejemplo, "Día de la semana", "Género", "País").
Un stripplot es esencialmente un diagrama de dispersión donde uno de los ejes representa una variable categórica. Visualiza la distribución de muchos valores individuales unidimensionales.
¿Por qué usar un Stripplot?
A diferencia de un histograma o un gráfico de densidad que agregan los datos, un stripplot muestra cada observación individual como un punto. Es ideal para conjuntos de datos pequeños donde se desea ver la dispersión exacta e identificar valores atípicos.
Parámetros clave para la personalización
Dado que los puntos pueden superponerse (un problema llamado "overplotting"), stripplot ofrece varias formas de hacerlos distinguibles:
alpha: controla la transparencia (de 0 a 1). Configurarlo en un valor bajo (por ejemplo,0.25) ayuda a visualizar la densidad — las áreas más oscuras indican más puntos;size: cambia el radio de los puntos;marker: cambia la forma de los puntos (por ejemplo,'D'para diamantes,'s'para cuadrados);jitter: añade una pequeña cantidad de ruido aleatorio a la posición de los puntos para que no queden exactamente uno sobre otro (activado por defecto).
Ejemplo en vivo
A continuación se muestra cómo crear un stripplot que utiliza la transparencia para manejar datos superpuestos.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualización de la distribución de cuentas por día con un estilo personalizado.
- Configuración del estilo en
'whitegrid'. Uso de un diccionario para establecer el color de fondo ('axes.facecolor') en'aliceblue'. - Creación de un stripplot utilizando el conjunto de datos
tips(df):
- Asignación de
'day'al ejexy'total_bill'al ejey. - Colorear los puntos según el estado de
'smoker'mediantehue. - Establecimiento del
sizede los puntos en20. - Uso de la paleta
'crest'. - Cambio de la forma del marcador a diamantes mediante
marker='D'. - Ajuste de la transparencia
alphaa0.25.
- Visualización del gráfico.
Solución
¡Gracias por tus comentarios!
single