Criando Histogramas
Por que usar histogramas?
Histogramas são utilizados para visualizar a distribuição de dados contínuos (numéricos). Eles mostram como os dados estão distribuídos em intervalos (bins) e ajudam a:
- Detectar assimetria, valores atípicos ou lacunas;
- Compreender a distribuição de frequências;
- Avaliar rapidamente se os dados seguem uma distribuição normal ou não.
São mais indicados para variáveis como preço, quilometragem ou idade.
Sintaxe do histograma no ggplot2
É possível criar um histograma utilizando geom_histogram()
, onde a variável x
deve ser numérica.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
A aparência do histograma pode ser personalizada com argumentos como bins
(número de intervalos), fill
(cor das barras), color
(cor da borda) e theme
para estilização.
Exemplo: Distribuição dos preços de venda
Um histograma pode ser utilizado para examinar como os preços dos carros estão distribuídos no conjunto de dados. Neste exemplo, as barras são preenchidas com azul aço e contornadas em preto, enquanto rótulos e um tema minimalista são adicionados para maior clareza.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Este gráfico revela o formato geral da distribuição dos preços de venda, facilitando a visualização se a maioria dos carros está em uma determinada faixa de preço ou se há valores atípicos nas extremidades inferior ou superior.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Can you explain the difference between a histogram and a bar plot?
How do I choose the right number of bins for my histogram?
What does it mean if my histogram is skewed to the right or left?
Awesome!
Completion rate improved to 4
Criando Histogramas
Deslize para mostrar o menu
Por que usar histogramas?
Histogramas são utilizados para visualizar a distribuição de dados contínuos (numéricos). Eles mostram como os dados estão distribuídos em intervalos (bins) e ajudam a:
- Detectar assimetria, valores atípicos ou lacunas;
- Compreender a distribuição de frequências;
- Avaliar rapidamente se os dados seguem uma distribuição normal ou não.
São mais indicados para variáveis como preço, quilometragem ou idade.
Sintaxe do histograma no ggplot2
É possível criar um histograma utilizando geom_histogram()
, onde a variável x
deve ser numérica.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
A aparência do histograma pode ser personalizada com argumentos como bins
(número de intervalos), fill
(cor das barras), color
(cor da borda) e theme
para estilização.
Exemplo: Distribuição dos preços de venda
Um histograma pode ser utilizado para examinar como os preços dos carros estão distribuídos no conjunto de dados. Neste exemplo, as barras são preenchidas com azul aço e contornadas em preto, enquanto rótulos e um tema minimalista são adicionados para maior clareza.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Este gráfico revela o formato geral da distribuição dos preços de venda, facilitando a visualização se a maioria dos carros está em uma determinada faixa de preço ou se há valores atípicos nas extremidades inferior ou superior.
Obrigado pelo seu feedback!