Visualización de Distribuciones Acumulativas
Un ecdfplot representa la proporción o el conteo de observaciones que se encuentran por debajo de cada valor único en un conjunto de datos.
En comparación con un histograma o un gráfico de densidad, tiene una ventaja significativa: cada observación se visualiza directamente. Esto significa que no hay intervalos que ajustar ni parámetros de suavizado que puedan distorsionar los datos. A menudo se considera la forma más "honesta" de visualizar una distribución.
Parámetros clave
Por defecto, el gráfico muestra la proporción (de 0 a 1) de datos menores que X. Puede cambiar este comportamiento:
stat='count': en lugar de un porcentaje, el eje Y muestra el número de observaciones;complementary=True: invierte la lógica. En lugar de mostrar valores por debajo del umbral, muestra valores por encima de este. Es esencialmente una "curva de supervivencia" (por ejemplo, "¿Cuántos pingüinos tienen un pico más largo que 50 mm?").
Ejemplo
Así es como complementary cambia la visualización. La curva desciende en lugar de ascender.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analizar las longitudes de los picos de los pingüinos para determinar cuántos superan una determinada longitud.
- Importar
pandas,seabornymatplotlib.pyplot. - Leer el conjunto de datos de pingüinos.
- Crear un gráfico ECDF:
- Establecer
xen'bill_length_mm'. - Agrupar por
'island'utilizandohue. - Activar el modo "supervivencia" configurando
complementary=True. - Mostrar números absolutos configurando
stat='count'. - Utilizar la paleta
'mako'. - Utilizar la variable
dfcomo datos.
- Visualizar el gráfico.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Genial!
Completion tasa mejorada a 4.55
Visualización de Distribuciones Acumulativas
Desliza para mostrar el menú
Un ecdfplot representa la proporción o el conteo de observaciones que se encuentran por debajo de cada valor único en un conjunto de datos.
En comparación con un histograma o un gráfico de densidad, tiene una ventaja significativa: cada observación se visualiza directamente. Esto significa que no hay intervalos que ajustar ni parámetros de suavizado que puedan distorsionar los datos. A menudo se considera la forma más "honesta" de visualizar una distribución.
Parámetros clave
Por defecto, el gráfico muestra la proporción (de 0 a 1) de datos menores que X. Puede cambiar este comportamiento:
stat='count': en lugar de un porcentaje, el eje Y muestra el número de observaciones;complementary=True: invierte la lógica. En lugar de mostrar valores por debajo del umbral, muestra valores por encima de este. Es esencialmente una "curva de supervivencia" (por ejemplo, "¿Cuántos pingüinos tienen un pico más largo que 50 mm?").
Ejemplo
Así es como complementary cambia la visualización. La curva desciende en lugar de ascender.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analizar las longitudes de los picos de los pingüinos para determinar cuántos superan una determinada longitud.
- Importar
pandas,seabornymatplotlib.pyplot. - Leer el conjunto de datos de pingüinos.
- Crear un gráfico ECDF:
- Establecer
xen'bill_length_mm'. - Agrupar por
'island'utilizandohue. - Activar el modo "supervivencia" configurando
complementary=True. - Mostrar números absolutos configurando
stat='count'. - Utilizar la paleta
'mako'. - Utilizar la variable
dfcomo datos.
- Visualizar el gráfico.
Solución
¡Gracias por tus comentarios!
single