Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Tipos de Dados | Conceitos de Machine Learning
Introdução ao ML com Scikit-Learn

bookTipos de Dados

Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado a ela. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.

Infelizmente, a maioria dos algoritmos de ML funciona bem apenas com números. Portanto, é necessário converter os dados categóricos e os dados de data/hora em números.

Em relação a data e hora, é possível utilizar características como 'year', 'month', etc., dependendo da tarefa. Essas características são valores numéricos, portanto, não apresentam problemas.

Dados categóricos são um pouco mais desafiadores de lidar.

Tipos de Dados Categóricos

Os dados categóricos são classificados em dois tipos:

  • Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;

  • Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.

Como você verá em capítulos posteriores, a conversão de tipos de dados ordinais e nominais para valores numéricos é diferente, por isso precisamos separá-los.

question-icon

Associe a característica ao seu tipo de dado.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Clique ou arraste solte itens e preencha os espaços

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 4

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 3.13

bookTipos de Dados

Deslize para mostrar o menu

Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado a ela. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.

Infelizmente, a maioria dos algoritmos de ML funciona bem apenas com números. Portanto, é necessário converter os dados categóricos e os dados de data/hora em números.

Em relação a data e hora, é possível utilizar características como 'year', 'month', etc., dependendo da tarefa. Essas características são valores numéricos, portanto, não apresentam problemas.

Dados categóricos são um pouco mais desafiadores de lidar.

Tipos de Dados Categóricos

Os dados categóricos são classificados em dois tipos:

  • Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;

  • Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.

Como você verá em capítulos posteriores, a conversão de tipos de dados ordinais e nominais para valores numéricos é diferente, por isso precisamos separá-los.

question-icon

Associe a característica ao seu tipo de dado.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Clique ou arraste solte itens e preencha os espaços

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 4
some-alt