Escalonamento de Dados vs Normalização de Dados

O escalamento de dados e a normalização são dois termos frequentemente utilizados como sinônimos, mas que na verdade referem-se a conceitos ligeiramente diferentes.

O escalamento de dados refere-se à transformação dos valores de um conjunto de dados de forma que eles se encaixem dentro de um intervalo específico. Isso pode envolver redimensionar os dados para um valor mínimo e máximo específicos, ou padronizar os dados de modo que eles tenham uma média de zero e um desvio padrão de um. O objetivo do escalamento de dados é garantir que todos os atributos do conjunto de dados estejam na mesma escala, para que nenhum atributo domine os outros.

Por outro lado, normalização refere-se ao processo de transformação dos valores de um conjunto de dados para que eles se ajustem a uma distribuição específica. Isso pode envolver transformar os dados para que eles tenham uma distribuição normal (gaussiana) ou alguma outra distribuição. A normalização visa tornar os dados mais interpretáveis ou atender às premissas de um teste estatístico particular ou algoritmo de aprendizado de máquina.

O escalamento de dados é uma etapa de pré-processamento mais comum em aprendizado de máquina, pois é frequentemente necessário para garantir que todos os atributos estejam na mesma escala, a fim de evitar viés e melhorar a acurácia. A normalização é menos usada, mas pode ser importante em certas situações, como quando se trabalha com dados com distribuição assimétrica ou ao usar certos testes estatísticos.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 2. Capítulo 2

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Conteúdo do Curso

Pré-processamento de Dados

1. Breve Introdução

Tipos de Dados Métodos de Processamento de Dados Conjunto de Dados: Teste e Treinamento Excluindo um Dado "Extra"Alterando o Tipo de Dados

2. Processamento de Dados Quantitativos

Escalonamento de Dados Escalonamento de Dados vs Normalização de Dados Removendo Outliers Removendo Valores Ausentes Aumento de Dados: Dados Sintéticos

3. Processamento de Dados Categóricos

Métodos para Codificar os Dados Categóricos Codificação One-Hot Codificação Ordinal Codificação de Rótulos da Variável Alvo Desafio

4. Processamento de Dados de Séries Temporais

Conversão de Tipo de Dados Limpeza de Dados Estacionaridade Redução de Ruído Divisão Treino/Teste & Validação Cruzada Desafio

5. Engenharia de Recursos

Ideia de Técnica Realização Extração de Características de Texto Extração de Características de Imagens Extração de Características de Séries Temporais Desafio

6. Passando para as Tarefas

Desafio 1 Desafio 2 Desafio 3

Escalonamento de Dados vs Normalização de Dados

O escalamento de dados e a normalização são dois termos frequentemente utilizados como sinônimos, mas que na verdade referem-se a conceitos ligeiramente diferentes.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 2. Capítulo 2