Criando Gráficos de Dispersão
Por que usar gráficos de dispersão?
Um gráfico de dispersão é ideal para visualizar relações entre variáveis. Pode ser utilizado para:
- Exibir relações entre duas variáveis numéricas;
- Detectar padrões, agrupamentos ou valores atípicos;
- Explorar correlação (positiva/negativa/nenhuma).
Sintaxe do gráfico de dispersão no ggplot2
É possível criar um gráfico de dispersão com geom_point()
. Para isso, especifique as estéticas para os eixos x
e y
.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Para diferenciar grupos dentro dos dados, adicione uma variável de agrupamento à estética color
. Isso atribui cores diferentes a cada grupo, facilitando a identificação de padrões.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Exemplo: Selling Price vs. Kilometers Driven
Um gráfico de dispersão pode ser utilizado para examinar como o uso de um carro se relaciona com seu preço de venda. Neste exemplo, o eixo x mostra o número de quilômetros rodados, enquanto o eixo y mostra o preço de venda.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Essa visualização frequentemente destaca tendências de depreciação – à medida que a quilometragem aumenta, o preço de venda geralmente diminui. Também pode revelar valores atípicos, como carros com preços incomumente altos apesar da alta quilometragem.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Can you explain how to interpret a scatter plot?
What does a negative correlation look like on a scatter plot?
How can I identify outliers using a scatter plot?
Awesome!
Completion rate improved to 4
Criando Gráficos de Dispersão
Deslize para mostrar o menu
Por que usar gráficos de dispersão?
Um gráfico de dispersão é ideal para visualizar relações entre variáveis. Pode ser utilizado para:
- Exibir relações entre duas variáveis numéricas;
- Detectar padrões, agrupamentos ou valores atípicos;
- Explorar correlação (positiva/negativa/nenhuma).
Sintaxe do gráfico de dispersão no ggplot2
É possível criar um gráfico de dispersão com geom_point()
. Para isso, especifique as estéticas para os eixos x
e y
.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Para diferenciar grupos dentro dos dados, adicione uma variável de agrupamento à estética color
. Isso atribui cores diferentes a cada grupo, facilitando a identificação de padrões.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Exemplo: Selling Price vs. Kilometers Driven
Um gráfico de dispersão pode ser utilizado para examinar como o uso de um carro se relaciona com seu preço de venda. Neste exemplo, o eixo x mostra o número de quilômetros rodados, enquanto o eixo y mostra o preço de venda.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Essa visualização frequentemente destaca tendências de depreciação – à medida que a quilometragem aumenta, o preço de venda geralmente diminui. Também pode revelar valores atípicos, como carros com preços incomumente altos apesar da alta quilometragem.
Obrigado pelo seu feedback!