Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Visualización de Histogramas | Sección
Practice
Projects
Quizzes & Challenges
Cuestionarios
Challenges
/
Visualización Estadística con Seaborn

bookVisualización de Histogramas

El histplot (gráfico de histograma) es una herramienta clásica que representa la distribución de una o más variables contando el número de observaciones que caen dentro de intervalos discretos. Ayuda a responder preguntas como: "¿Cuál es el valor más común?", "¿Los datos son simétricos?" o "¿Existen valores atípicos?".

Personalización del histograma

Por defecto, histplot dibuja barras y cuenta el número de ocurrencias. Sin embargo, se puede personalizar para revelar más información.

1. Cambio de estadística (stat)

En lugar de un simple conteo, se puede calcular la densidad. Esto es útil al comparar grupos de diferentes tamaños, ya que normaliza el área bajo la curva a 1.

stat='density'

2. Estilo visual (element)

Al graficar varios grupos usando hue, las barras estándar pueden resultar confusas. Utilizar un gráfico de líneas escalonadas crea un contorno, facilitando la visualización de superposiciones.

element='step'

3. Ancho de los intervalos (binwidth)

El tamaño de los intervalos determina el nivel de detalle que se observa.

binwidth=1

Ejemplo: aquí se muestra cómo combinar estos parámetros para crear un gráfico de densidad con líneas escalonadas:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Tarea

Swipe to start coding

Crear una visualización clara de las longitudes de los picos de los pingüinos:

  1. Inicializar un histplot utilizando el dataframe df.
  2. Establecer x como 'bill_length_mm'.
  3. Agrupar los datos por 'island' usando el parámetro hue.
  4. Cambiar el estilo visual a 'step' mediante el parámetro element.
  5. Cambiar el eje Y para representar 'density' usando el parámetro stat.
  6. Definir el binwidth en 1 y utilizar la paleta 'flare'.
  7. Mostrar la gráfica.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 4
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

bookVisualización de Histogramas

Desliza para mostrar el menú

El histplot (gráfico de histograma) es una herramienta clásica que representa la distribución de una o más variables contando el número de observaciones que caen dentro de intervalos discretos. Ayuda a responder preguntas como: "¿Cuál es el valor más común?", "¿Los datos son simétricos?" o "¿Existen valores atípicos?".

Personalización del histograma

Por defecto, histplot dibuja barras y cuenta el número de ocurrencias. Sin embargo, se puede personalizar para revelar más información.

1. Cambio de estadística (stat)

En lugar de un simple conteo, se puede calcular la densidad. Esto es útil al comparar grupos de diferentes tamaños, ya que normaliza el área bajo la curva a 1.

stat='density'

2. Estilo visual (element)

Al graficar varios grupos usando hue, las barras estándar pueden resultar confusas. Utilizar un gráfico de líneas escalonadas crea un contorno, facilitando la visualización de superposiciones.

element='step'

3. Ancho de los intervalos (binwidth)

El tamaño de los intervalos determina el nivel de detalle que se observa.

binwidth=1

Ejemplo: aquí se muestra cómo combinar estos parámetros para crear un gráfico de densidad con líneas escalonadas:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Tarea

Swipe to start coding

Crear una visualización clara de las longitudes de los picos de los pingüinos:

  1. Inicializar un histplot utilizando el dataframe df.
  2. Establecer x como 'bill_length_mm'.
  3. Agrupar los datos por 'island' usando el parámetro hue.
  4. Cambiar el estilo visual a 'step' mediante el parámetro element.
  5. Cambiar el eje Y para representar 'density' usando el parámetro stat.
  6. Definir el binwidth en 1 y utilizar la paleta 'flare'.
  7. Mostrar la gráfica.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 4
single

single

some-alt