Criando Gráficos de Dispersão
Por que usar gráficos de dispersão?
Um gráfico de dispersão é ideal para visualizar relações entre variáveis. Ele pode ser utilizado para:
- Exibir relações entre duas variáveis numéricas;
- Detectar padrões, agrupamentos ou valores atípicos;
- Explorar correlação (positiva/negativa/nenhuma).
Sintaxe do gráfico de dispersão no ggplot2
É possível criar um gráfico de dispersão com geom_point()
. Para isso, especifique as estéticas para os eixos x
e y
.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Para diferenciar grupos dentro dos dados, adicione uma variável de agrupamento à estética color
. Isso atribui cores diferentes a cada grupo, facilitando a identificação de padrões.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Exemplo: Preço de venda vs. Quilômetros rodados
Um gráfico de dispersão pode ser utilizado para analisar como o uso de um carro se relaciona com seu preço de venda. Neste exemplo, o eixo x mostra o número de quilômetros rodados, enquanto o eixo y apresenta o preço de venda.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Essa visualização frequentemente destaca tendências de depreciação – à medida que a quilometragem aumenta, o preço de venda geralmente diminui. Também pode revelar valores atípicos, como carros com preços incomumente altos apesar da alta quilometragem.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 4
Criando Gráficos de Dispersão
Deslize para mostrar o menu
Por que usar gráficos de dispersão?
Um gráfico de dispersão é ideal para visualizar relações entre variáveis. Ele pode ser utilizado para:
- Exibir relações entre duas variáveis numéricas;
- Detectar padrões, agrupamentos ou valores atípicos;
- Explorar correlação (positiva/negativa/nenhuma).
Sintaxe do gráfico de dispersão no ggplot2
É possível criar um gráfico de dispersão com geom_point()
. Para isso, especifique as estéticas para os eixos x
e y
.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Para diferenciar grupos dentro dos dados, adicione uma variável de agrupamento à estética color
. Isso atribui cores diferentes a cada grupo, facilitando a identificação de padrões.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Exemplo: Preço de venda vs. Quilômetros rodados
Um gráfico de dispersão pode ser utilizado para analisar como o uso de um carro se relaciona com seu preço de venda. Neste exemplo, o eixo x mostra o número de quilômetros rodados, enquanto o eixo y apresenta o preço de venda.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Essa visualização frequentemente destaca tendências de depreciação – à medida que a quilometragem aumenta, o preço de venda geralmente diminui. Também pode revelar valores atípicos, como carros com preços incomumente altos apesar da alta quilometragem.
Obrigado pelo seu feedback!