Conjunto de Treinamento
Em aprendizado supervisionado ou não supervisionado, o conjunto de treinamento geralmente é apresentado em formato tabular.
Um exemplo é o diabetes dataset, utilizado para prever se uma pessoa tem diabetes. Ele contém registros de 768 mulheres com parâmetros como idade, índice de massa corporal e pressão arterial. Esses parâmetros são chamados de features.
O conjunto de dados também inclui uma coluna 'Outcome'
indicando se a pessoa tem diabetes. Esta é a variável target.
Cada linha da tabela é uma instância (também chamada de data point ou sample), representando informações sobre um único indivíduo.
A tabela (conjunto de treinamento) possui uma target column, o que significa que é rotulada.
O objetivo é treinar o modelo de ML neste conjunto de treinamento e, uma vez treinado, ele pode prever para outras pessoas (novas instâncias) se elas têm diabetes com base apenas nas features.
Este conjunto de treinamento é um exemplo de conjunto de dados enviesado, pois contém exclusivamente informações sobre mulheres com pelo menos 21 anos de idade. Portanto, o modelo pode produzir previsões menos precisas para homens ou para mulheres com menos de 21 anos, já que não foi treinado nesses grupos.
Durante a codificação, as colunas de características geralmente são atribuídas a X
e as colunas alvo são atribuídas como y
.
E as características de novas instâncias são atribuídas como X_new
.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.13
Conjunto de Treinamento
Deslize para mostrar o menu
Em aprendizado supervisionado ou não supervisionado, o conjunto de treinamento geralmente é apresentado em formato tabular.
Um exemplo é o diabetes dataset, utilizado para prever se uma pessoa tem diabetes. Ele contém registros de 768 mulheres com parâmetros como idade, índice de massa corporal e pressão arterial. Esses parâmetros são chamados de features.
O conjunto de dados também inclui uma coluna 'Outcome'
indicando se a pessoa tem diabetes. Esta é a variável target.
Cada linha da tabela é uma instância (também chamada de data point ou sample), representando informações sobre um único indivíduo.
A tabela (conjunto de treinamento) possui uma target column, o que significa que é rotulada.
O objetivo é treinar o modelo de ML neste conjunto de treinamento e, uma vez treinado, ele pode prever para outras pessoas (novas instâncias) se elas têm diabetes com base apenas nas features.
Este conjunto de treinamento é um exemplo de conjunto de dados enviesado, pois contém exclusivamente informações sobre mulheres com pelo menos 21 anos de idade. Portanto, o modelo pode produzir previsões menos precisas para homens ou para mulheres com menos de 21 anos, já que não foi treinado nesses grupos.
Durante a codificação, as colunas de características geralmente são atribuídas a X
e as colunas alvo são atribuídas como y
.
E as características de novas instâncias são atribuídas como X_new
.
Obrigado pelo seu feedback!