Deslize para mostrar o menu

Em aprendizado supervisionado ou não supervisionado, o conjunto de treinamento geralmente é apresentado em formato tabular.

Um exemplo é o conjunto de dados de diabetes, utilizado para prever se uma pessoa tem diabetes. Ele contém registros de 768 mulheres com parâmetros como idade, índice de massa corporal e pressão arterial. Esses parâmetros são chamados de características.

O conjunto de dados também inclui uma coluna 'Outcome' indicando se a pessoa tem diabetes. Esta é a variável alvo.

Cada linha da tabela é uma instância (também chamada de ponto de dados ou amostra), representando informações sobre um único indivíduo.

A tabela (conjunto de treinamento) possui uma coluna alvo, o que significa que ela é rotulada.

A tarefa é treinar o modelo de ML neste conjunto de treinamento e, uma vez treinado, ele pode prever para outras pessoas (novas instâncias) se elas têm diabetes com base apenas nas características.

Nota

Este conjunto de treinamento é um exemplo de conjunto de dados tendencioso, pois contém exclusivamente informações sobre mulheres com pelo menos 21 anos de idade. Portanto, o modelo pode produzir previsões menos precisas para homens ou para mulheres com menos de 21 anos, já que não foi treinado nesses grupos.

Durante a programação, as colunas de características geralmente são atribuídas a X e as colunas alvo são atribuídas como y.

E as características de novas instâncias são atribuídas como X_new.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Conjunto de Treinamento