Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Resumen de Datos con Diagramas de Caja | Sección
Visualización Estadística con Seaborn

bookResumen de Datos con Diagramas de Caja

Un boxplot es una forma estandarizada de mostrar la distribución de los datos basada en un resumen de cinco números:

  1. Mínimo (valor más bajo excluyendo valores atípicos);
  2. Primer cuartil (Q1) (percentil 25);
  3. Mediana (percentil 50);
  4. Tercer cuartil (Q3) (percentil 75);
  5. Máximo (valor más alto excluyendo valores atípicos).

¿Por qué usar un Boxplot?

Es la mejor herramienta para comparar distribuciones entre grupos. Permite identificar de inmediato:

  • Tendencia central: ¿dónde se encuentra la línea de la mediana?;
  • Dispersión: ¿qué tan alta es la caja? (el rango intercuartílico);
  • Simetría: ¿la mediana está en el centro de la caja?;
  • Valores atípicos: ¿hay puntos fuera de los bigotes?

Parámetros clave

  • saturation: controla la intensidad de los colores (0 a 1). Valores más bajos hacen que los colores sean más apagados;
  • linewidth: controla el grosor de los bordes de la caja y los bigotes;
  • width: controla el ancho de la propia caja.

Ejemplo

Aquí se muestra un diagrama de caja que analiza el conjunto de datos "Tips". Observe cómo los puntos que representan valores atípicos aparecen por encima de los bigotes.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tarea

Swipe to start coding

Visualización de la distancia de planetas descubiertos por diferentes métodos.

  1. Configuración del estilo en 'ticks'. Personalización del tema mediante un diccionario para cambiar el fondo a 'grey' ('figure.facecolor') y los colores de las marcas a 'white' ('xtick.color' y 'ytick.color').
  2. Creación de un boxplot utilizando el conjunto de datos planets (df):
  • Asignación de 'distance' al eje x y 'method' al eje y.
  • Establecimiento del width de la caja en 0.6.
  • Grosor de las líneas aumentado mediante linewidth=2.
  • Atenuación significativa de los colores configurando saturation en 0.4.
  • Uso de la paleta 'vlag'.
  1. Visualización del gráfico.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 11
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

bookResumen de Datos con Diagramas de Caja

Desliza para mostrar el menú

Un boxplot es una forma estandarizada de mostrar la distribución de los datos basada en un resumen de cinco números:

  1. Mínimo (valor más bajo excluyendo valores atípicos);
  2. Primer cuartil (Q1) (percentil 25);
  3. Mediana (percentil 50);
  4. Tercer cuartil (Q3) (percentil 75);
  5. Máximo (valor más alto excluyendo valores atípicos).

¿Por qué usar un Boxplot?

Es la mejor herramienta para comparar distribuciones entre grupos. Permite identificar de inmediato:

  • Tendencia central: ¿dónde se encuentra la línea de la mediana?;
  • Dispersión: ¿qué tan alta es la caja? (el rango intercuartílico);
  • Simetría: ¿la mediana está en el centro de la caja?;
  • Valores atípicos: ¿hay puntos fuera de los bigotes?

Parámetros clave

  • saturation: controla la intensidad de los colores (0 a 1). Valores más bajos hacen que los colores sean más apagados;
  • linewidth: controla el grosor de los bordes de la caja y los bigotes;
  • width: controla el ancho de la propia caja.

Ejemplo

Aquí se muestra un diagrama de caja que analiza el conjunto de datos "Tips". Observe cómo los puntos que representan valores atípicos aparecen por encima de los bigotes.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tarea

Swipe to start coding

Visualización de la distancia de planetas descubiertos por diferentes métodos.

  1. Configuración del estilo en 'ticks'. Personalización del tema mediante un diccionario para cambiar el fondo a 'grey' ('figure.facecolor') y los colores de las marcas a 'white' ('xtick.color' y 'ytick.color').
  2. Creación de un boxplot utilizando el conjunto de datos planets (df):
  • Asignación de 'distance' al eje x y 'method' al eje y.
  • Establecimiento del width de la caja en 0.6.
  • Grosor de las líneas aumentado mediante linewidth=2.
  • Atenuación significativa de los colores configurando saturation en 0.4.
  • Uso de la paleta 'vlag'.
  1. Visualización del gráfico.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 11
single

single

some-alt