Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Conjunto de Treinamento | Conceitos de Machine Learning
Introdução ao ML com Scikit-learn

bookConjunto de Treinamento

Em aprendizado supervisionado ou não supervisionado, o conjunto de treinamento geralmente é apresentado em formato tabular.

Um exemplo é o diabetes dataset, utilizado para prever se uma pessoa tem diabetes. Ele contém registros de 768 mulheres com parâmetros como idade, índice de massa corporal e pressão arterial. Esses parâmetros são chamados de features.

O conjunto de dados também inclui uma coluna 'Outcome' indicando se a pessoa tem diabetes. Esta é a variável target.

Cada linha da tabela é uma instância (também chamada de data point ou sample), representando informações sobre um único indivíduo.

A tabela (conjunto de treinamento) possui uma target column, o que significa que é rotulada.

O objetivo é treinar o modelo de ML neste conjunto de treinamento e, uma vez treinado, ele pode prever para outras pessoas (novas instâncias) se elas têm diabetes com base apenas nas features.

Note
Nota

Este conjunto de treinamento é um exemplo de conjunto de dados enviesado, pois contém exclusivamente informações sobre mulheres com pelo menos 21 anos de idade. Portanto, o modelo pode produzir previsões menos precisas para homens ou para mulheres com menos de 21 anos, já que não foi treinado nesses grupos.

Durante a codificação, as colunas de características geralmente são atribuídas a X e as colunas alvo são atribuídas como y.

E as características de novas instâncias são atribuídas como X_new.

question-icon

Associe os nomes das variáveis com os dados que normalmente armazenam.

X –
y –

X_new –

Clique ou arraste solte itens e preencha os espaços

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 3.13

bookConjunto de Treinamento

Deslize para mostrar o menu

Em aprendizado supervisionado ou não supervisionado, o conjunto de treinamento geralmente é apresentado em formato tabular.

Um exemplo é o diabetes dataset, utilizado para prever se uma pessoa tem diabetes. Ele contém registros de 768 mulheres com parâmetros como idade, índice de massa corporal e pressão arterial. Esses parâmetros são chamados de features.

O conjunto de dados também inclui uma coluna 'Outcome' indicando se a pessoa tem diabetes. Esta é a variável target.

Cada linha da tabela é uma instância (também chamada de data point ou sample), representando informações sobre um único indivíduo.

A tabela (conjunto de treinamento) possui uma target column, o que significa que é rotulada.

O objetivo é treinar o modelo de ML neste conjunto de treinamento e, uma vez treinado, ele pode prever para outras pessoas (novas instâncias) se elas têm diabetes com base apenas nas features.

Note
Nota

Este conjunto de treinamento é um exemplo de conjunto de dados enviesado, pois contém exclusivamente informações sobre mulheres com pelo menos 21 anos de idade. Portanto, o modelo pode produzir previsões menos precisas para homens ou para mulheres com menos de 21 anos, já que não foi treinado nesses grupos.

Durante a codificação, as colunas de características geralmente são atribuídas a X e as colunas alvo são atribuídas como y.

E as características de novas instâncias são atribuídas como X_new.

question-icon

Associe os nomes das variáveis com os dados que normalmente armazenam.

X –
y –

X_new –

Clique ou arraste solte itens e preencha os espaços

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3
some-alt