Modelos
Os fundamentos do pré-processamento de dados e da construção de pipelines já foram abordados. O próximo passo é a modelagem.
Um modelo no Scikit-learn é um estimador que fornece os métodos .predict() e .score(), além do .fit() herdado de todos os estimadores.
.fit()
Após o pré-processamento dos dados e estando prontos para o modelo, o primeiro passo na construção de um modelo é o treinamento do modelo. Isso é feito utilizando o .fit(X, y).
Para aprendizado supervisionado (regressão, classificação), .fit() requer tanto X quanto y.
Para aprendizado não supervisionado (por exemplo, clustering), utilize apenas .fit(X). Passar y não gera erro — ele simplesmente é ignorado.
Durante o treinamento, o modelo aprende padrões necessários para a previsão. O que é aprendido e o tempo de treinamento dependem do algoritmo. O treinamento geralmente é a parte mais lenta do aprendizado de máquina, especialmente com grandes conjuntos de dados.
.predict()
Após o treinamento, utilize .predict() para gerar previsões:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() avalia um modelo treinado, normalmente em um conjunto de teste:
model.fit(X, y)
model.score(X_test, y_test)
Compara as previsões com os verdadeiros alvos. Por padrão, a métrica é acurácia para classificação.
X_test refere-se ao subconjunto do conjunto de dados, conhecido como conjunto de teste, utilizado para avaliar o desempenho de um modelo após o treinamento. Ele contém as features (dados de entrada). y_test é o subconjunto correspondente de rótulos verdadeiros para X_test. Juntos, eles avaliam o quão bem o modelo prevê novos dados não vistos.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Incrível!
Completion taxa melhorada para 3.13
Modelos
Deslize para mostrar o menu
Os fundamentos do pré-processamento de dados e da construção de pipelines já foram abordados. O próximo passo é a modelagem.
Um modelo no Scikit-learn é um estimador que fornece os métodos .predict() e .score(), além do .fit() herdado de todos os estimadores.
.fit()
Após o pré-processamento dos dados e estando prontos para o modelo, o primeiro passo na construção de um modelo é o treinamento do modelo. Isso é feito utilizando o .fit(X, y).
Para aprendizado supervisionado (regressão, classificação), .fit() requer tanto X quanto y.
Para aprendizado não supervisionado (por exemplo, clustering), utilize apenas .fit(X). Passar y não gera erro — ele simplesmente é ignorado.
Durante o treinamento, o modelo aprende padrões necessários para a previsão. O que é aprendido e o tempo de treinamento dependem do algoritmo. O treinamento geralmente é a parte mais lenta do aprendizado de máquina, especialmente com grandes conjuntos de dados.
.predict()
Após o treinamento, utilize .predict() para gerar previsões:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() avalia um modelo treinado, normalmente em um conjunto de teste:
model.fit(X, y)
model.score(X_test, y_test)
Compara as previsões com os verdadeiros alvos. Por padrão, a métrica é acurácia para classificação.
X_test refere-se ao subconjunto do conjunto de dados, conhecido como conjunto de teste, utilizado para avaliar o desempenho de um modelo após o treinamento. Ele contém as features (dados de entrada). y_test é o subconjunto correspondente de rótulos verdadeiros para X_test. Juntos, eles avaliam o quão bem o modelo prevê novos dados não vistos.
Obrigado pelo seu feedback!