Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Visualización de Distribuciones Acumulativas | Sección
Visualización Estadística con Seaborn

bookVisualización de Distribuciones Acumulativas

Un ecdfplot representa la proporción o el conteo de observaciones que se encuentran por debajo de cada valor único en un conjunto de datos.

En comparación con un histograma o un gráfico de densidad, tiene una ventaja significativa: cada observación se visualiza directamente. Esto significa que no hay intervalos que ajustar ni parámetros de suavizado que puedan distorsionar los datos. A menudo se considera la forma más "honesta" de visualizar una distribución.

Parámetros clave

Por defecto, el gráfico muestra la proporción (de 0 a 1) de datos menores que X. Puede cambiar este comportamiento:

  • stat='count': en lugar de un porcentaje, el eje Y muestra el número de observaciones;
  • complementary=True: invierte la lógica. En lugar de mostrar valores por debajo del umbral, muestra valores por encima de este. Es esencialmente una "curva de supervivencia" (por ejemplo, "¿Cuántos pingüinos tienen un pico más largo que 50 mm?").

Ejemplo

Así es como complementary cambia la visualización. La curva desciende en lugar de ascender.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tarea

Swipe to start coding

Analizar las longitudes de los picos de los pingüinos para determinar cuántos superan una determinada longitud.

  1. Importar pandas, seaborn y matplotlib.pyplot.
  2. Leer el conjunto de datos de pingüinos.
  3. Crear un gráfico ECDF:
  • Establecer x en 'bill_length_mm'.
  • Agrupar por 'island' utilizando hue.
  • Activar el modo "supervivencia" configurando complementary=True.
  • Mostrar números absolutos configurando stat='count'.
  • Utilizar la paleta 'mako'.
  • Utilizar la variable df como datos.
  1. Visualizar el gráfico.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 7
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

bookVisualización de Distribuciones Acumulativas

Desliza para mostrar el menú

Un ecdfplot representa la proporción o el conteo de observaciones que se encuentran por debajo de cada valor único en un conjunto de datos.

En comparación con un histograma o un gráfico de densidad, tiene una ventaja significativa: cada observación se visualiza directamente. Esto significa que no hay intervalos que ajustar ni parámetros de suavizado que puedan distorsionar los datos. A menudo se considera la forma más "honesta" de visualizar una distribución.

Parámetros clave

Por defecto, el gráfico muestra la proporción (de 0 a 1) de datos menores que X. Puede cambiar este comportamiento:

  • stat='count': en lugar de un porcentaje, el eje Y muestra el número de observaciones;
  • complementary=True: invierte la lógica. En lugar de mostrar valores por debajo del umbral, muestra valores por encima de este. Es esencialmente una "curva de supervivencia" (por ejemplo, "¿Cuántos pingüinos tienen un pico más largo que 50 mm?").

Ejemplo

Así es como complementary cambia la visualización. La curva desciende en lugar de ascender.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tarea

Swipe to start coding

Analizar las longitudes de los picos de los pingüinos para determinar cuántos superan una determinada longitud.

  1. Importar pandas, seaborn y matplotlib.pyplot.
  2. Leer el conjunto de datos de pingüinos.
  3. Crear un gráfico ECDF:
  • Establecer x en 'bill_length_mm'.
  • Agrupar por 'island' utilizando hue.
  • Activar el modo "supervivencia" configurando complementary=True.
  • Mostrar números absolutos configurando stat='count'.
  • Utilizar la paleta 'mako'.
  • Utilizar la variable df como datos.
  1. Visualizar el gráfico.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 7
single

single

some-alt