Creación de Histogramas
¿Por qué usar histogramas?
Los histogramas se utilizan para visualizar la distribución de datos continuos (numéricos). Muestran cómo los datos se distribuyen a lo largo de rangos (bins) y ayudan a:
- Detectar asimetría, valores atípicos o huecos;
- Comprender la distribución de frecuencias;
- Evaluar rápidamente si los datos siguen una distribución normal o no.
Son más adecuados para variables como precio, kilometraje o edad.
Sintaxis de histograma en ggplot2
Se puede crear un histograma usando geom_histogram()
, donde la variable x
debe ser numérica.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
La apariencia del histograma puede personalizarse utilizando argumentos como bins
(número de bins), fill
(color de las barras), color
(color del borde) y theme
para el estilo.
Ejemplo: Distribución de precios de venta
Un histograma puede utilizarse para examinar cómo se distribuyen los precios de los autos en el conjunto de datos. En este ejemplo, las barras están rellenas de azul acero y delineadas en negro, mientras que se añaden etiquetas y un tema minimalista para mayor claridad.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Este gráfico revela la forma general de la distribución de los precios de venta, facilitando la identificación de si la mayoría de los autos se encuentran dentro de un rango de precios particular o si existen valores atípicos en los extremos alto o bajo.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 4
Creación de Histogramas
Desliza para mostrar el menú
¿Por qué usar histogramas?
Los histogramas se utilizan para visualizar la distribución de datos continuos (numéricos). Muestran cómo los datos se distribuyen a lo largo de rangos (bins) y ayudan a:
- Detectar asimetría, valores atípicos o huecos;
- Comprender la distribución de frecuencias;
- Evaluar rápidamente si los datos siguen una distribución normal o no.
Son más adecuados para variables como precio, kilometraje o edad.
Sintaxis de histograma en ggplot2
Se puede crear un histograma usando geom_histogram()
, donde la variable x
debe ser numérica.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
La apariencia del histograma puede personalizarse utilizando argumentos como bins
(número de bins), fill
(color de las barras), color
(color del borde) y theme
para el estilo.
Ejemplo: Distribución de precios de venta
Un histograma puede utilizarse para examinar cómo se distribuyen los precios de los autos en el conjunto de datos. En este ejemplo, las barras están rellenas de azul acero y delineadas en negro, mientras que se añaden etiquetas y un tema minimalista para mayor claridad.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Este gráfico revela la forma general de la distribución de los precios de venta, facilitando la identificación de si la mayoría de los autos se encuentran dentro de un rango de precios particular o si existen valores atípicos en los extremos alto o bajo.
¡Gracias por tus comentarios!