Tipos de Dados
Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado a ela. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.
Infelizmente, a maioria dos algoritmos de ML funciona bem apenas com números. Portanto, é necessário converter os dados categóricos e os dados de data/hora em números.
Em relação a data e hora, é possível utilizar características como 'year'
, 'month'
, etc., dependendo da tarefa. Essas características são valores numéricos, portanto, não apresentam problemas.
Dados categóricos são um pouco mais desafiadores de lidar.
Tipos de Dados Categóricos
Os dados categóricos são classificados em dois tipos:
-
Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;
-
Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.
Como você verá em capítulos posteriores, a conversão de tipos de dados ordinais e nominais para valores numéricos é diferente, por isso precisamos separá-los.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.13
Tipos de Dados
Deslize para mostrar o menu
Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado a ela. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.
Infelizmente, a maioria dos algoritmos de ML funciona bem apenas com números. Portanto, é necessário converter os dados categóricos e os dados de data/hora em números.
Em relação a data e hora, é possível utilizar características como 'year'
, 'month'
, etc., dependendo da tarefa. Essas características são valores numéricos, portanto, não apresentam problemas.
Dados categóricos são um pouco mais desafiadores de lidar.
Tipos de Dados Categóricos
Os dados categóricos são classificados em dois tipos:
-
Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;
-
Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.
Como você verá em capítulos posteriores, a conversão de tipos de dados ordinais e nominais para valores numéricos é diferente, por isso precisamos separá-los.
Obrigado pelo seu feedback!