Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Estimación de Densidad con KDE | Sección
Visualización Estadística con Seaborn

bookEstimación de Densidad con KDE

Un kdeplot (estimación de densidad por núcleo) es un método para visualizar la distribución de observaciones en un conjunto de datos. Es análogo a un histograma, pero en lugar de utilizar intervalos discretos, KDE representa los datos mediante una curva continua de densidad de probabilidad.

Esto lo hace excelente para observar la "forma" de los datos e identificar picos sin la irregularidad de un histograma.

Visualización de distribuciones superpuestas

Cuando se tienen múltiples categorías (usando hue), las líneas simples pueden volverse difíciles de distinguir. Seaborn ofrece parámetros para solucionar esto:

  • Apilado (multiple='stack'): en lugar de trazar líneas una sobre otra, las apila. Muestra cómo las diferentes categorías contribuyen a la distribución total;
  • Relleno (fill=True): rellena el área bajo la curva con color, haciendo más evidente el peso visual de cada categoría.

Ejemplo:

12345678910111213141516
import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
copy
Tarea

Swipe to start coding

Visualización de la distribución de las temperaturas máximas a lo largo del año:

  1. Importar pandas, seaborn y matplotlib.pyplot.
  2. Leer el conjunto de datos meteorológicos.
  3. Establecer el estilo en 'ticks' con un color de fondo 'lightcyan' (ya proporcionado).
  4. Crear un gráfico KDE con los siguientes parámetros:
  • Asignar x a 'max_temp';
  • Agrupar por 'month' utilizando hue;
  • Apilar las distribuciones usando multiple='stack';
  • Rellenar las curvas con fill=True;
  • Desactivar la leyenda (legend=False) para evitar sobrecargar el gráfico.
  1. Mostrar el gráfico.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

bookEstimación de Densidad con KDE

Desliza para mostrar el menú

Un kdeplot (estimación de densidad por núcleo) es un método para visualizar la distribución de observaciones en un conjunto de datos. Es análogo a un histograma, pero en lugar de utilizar intervalos discretos, KDE representa los datos mediante una curva continua de densidad de probabilidad.

Esto lo hace excelente para observar la "forma" de los datos e identificar picos sin la irregularidad de un histograma.

Visualización de distribuciones superpuestas

Cuando se tienen múltiples categorías (usando hue), las líneas simples pueden volverse difíciles de distinguir. Seaborn ofrece parámetros para solucionar esto:

  • Apilado (multiple='stack'): en lugar de trazar líneas una sobre otra, las apila. Muestra cómo las diferentes categorías contribuyen a la distribución total;
  • Relleno (fill=True): rellena el área bajo la curva con color, haciendo más evidente el peso visual de cada categoría.

Ejemplo:

12345678910111213141516
import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
copy
Tarea

Swipe to start coding

Visualización de la distribución de las temperaturas máximas a lo largo del año:

  1. Importar pandas, seaborn y matplotlib.pyplot.
  2. Leer el conjunto de datos meteorológicos.
  3. Establecer el estilo en 'ticks' con un color de fondo 'lightcyan' (ya proporcionado).
  4. Crear un gráfico KDE con los siguientes parámetros:
  • Asignar x a 'max_temp';
  • Agrupar por 'month' utilizando hue;
  • Apilar las distribuciones usando multiple='stack';
  • Rellenar las curvas con fill=True;
  • Desactivar la leyenda (legend=False) para evitar sobrecargar el gráfico.
  1. Mostrar el gráfico.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5
single

single

some-alt