Estatísticas Descritivas
Compreender seus dados começa com estatísticas descritivas – elas fornecem resumos essenciais sobre a distribuição, tendência central e dispersão das variáveis.
Estatísticas Descritivas Básicas
As medidas estatísticas mais comuns são:
- Média: valor médio;
- Desvio padrão: quanto os valores se desviam da média;
- Mediana: valor central;
- Mín / máx: menores e maiores valores.
Essas medidas fornecem uma visão geral rápida de como suas variáveis estão distribuídas.
Base R
O R base oferece funções simples para calcular estatísticas descritivas. A função summary()
também produz uma visão estatística rápida de todas as colunas numéricas.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Com o dplyr
, é possível utilizar summarise()
para calcular várias estatísticas de uma só vez em um formato limpo e legível.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 4
Estatísticas Descritivas
Deslize para mostrar o menu
Compreender seus dados começa com estatísticas descritivas – elas fornecem resumos essenciais sobre a distribuição, tendência central e dispersão das variáveis.
Estatísticas Descritivas Básicas
As medidas estatísticas mais comuns são:
- Média: valor médio;
- Desvio padrão: quanto os valores se desviam da média;
- Mediana: valor central;
- Mín / máx: menores e maiores valores.
Essas medidas fornecem uma visão geral rápida de como suas variáveis estão distribuídas.
Base R
O R base oferece funções simples para calcular estatísticas descritivas. A função summary()
também produz uma visão estatística rápida de todas as colunas numéricas.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Com o dplyr
, é possível utilizar summarise()
para calcular várias estatísticas de uma só vez em um formato limpo e legível.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Obrigado pelo seu feedback!