Criando Histogramas
Por que usar histogramas?
Histogramas são utilizados para visualizar a distribuição de dados contínuos (numéricos). Eles mostram como os dados estão distribuídos em intervalos (bins) e auxiliam em:
- Detectar assimetria, valores atípicos ou lacunas;
- Compreender a distribuição de frequências;
- Avaliar rapidamente se os dados seguem uma distribuição normal ou não.
São mais indicados para variáveis como preço, quilometragem ou idade.
Sintaxe do histograma no ggplot2
É possível criar um histograma utilizando geom_histogram()
, onde a variável x
deve ser numérica.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
A aparência do histograma pode ser personalizada com argumentos como bins
(número de intervalos), fill
(cor das barras), color
(cor da borda) e theme
para estilização.
Exemplo: Distribuição dos preços de venda
Um histograma pode ser utilizado para examinar como os preços dos carros estão distribuídos no conjunto de dados. Neste exemplo, as barras são preenchidas com azul aço e contornadas em preto, enquanto rótulos e um tema minimalista são adicionados para maior clareza.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Este gráfico revela o formato geral da distribuição dos preços de venda, facilitando a visualização se a maioria dos carros está concentrada em uma determinada faixa de preço ou se há valores atípicos nas extremidades inferior ou superior.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 4
Criando Histogramas
Deslize para mostrar o menu
Por que usar histogramas?
Histogramas são utilizados para visualizar a distribuição de dados contínuos (numéricos). Eles mostram como os dados estão distribuídos em intervalos (bins) e auxiliam em:
- Detectar assimetria, valores atípicos ou lacunas;
- Compreender a distribuição de frequências;
- Avaliar rapidamente se os dados seguem uma distribuição normal ou não.
São mais indicados para variáveis como preço, quilometragem ou idade.
Sintaxe do histograma no ggplot2
É possível criar um histograma utilizando geom_histogram()
, onde a variável x
deve ser numérica.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
A aparência do histograma pode ser personalizada com argumentos como bins
(número de intervalos), fill
(cor das barras), color
(cor da borda) e theme
para estilização.
Exemplo: Distribuição dos preços de venda
Um histograma pode ser utilizado para examinar como os preços dos carros estão distribuídos no conjunto de dados. Neste exemplo, as barras são preenchidas com azul aço e contornadas em preto, enquanto rótulos e um tema minimalista são adicionados para maior clareza.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Este gráfico revela o formato geral da distribuição dos preços de venda, facilitando a visualização se a maioria dos carros está concentrada em uma determinada faixa de preço ou se há valores atípicos nas extremidades inferior ou superior.
Obrigado pelo seu feedback!