Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Modelos | Modelagem
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Introdução ao Aprendizado de Máquina com Python

bookModelos

Os fundamentos do pré-processamento de dados e da construção de pipelines já foram abordados. O próximo passo é a modelagem.

Um modelo no Scikit-learn é um estimador que fornece os métodos .predict() e .score(), além do .fit() herdado de todos os estimadores.

.fit()

Após o pré-processamento dos dados e estando prontos para o modelo, o primeiro passo na construção de um modelo é o treinamento do modelo. Isso é feito utilizando o .fit(X, y).

Note
Nota

Para aprendizado supervisionado (regressão, classificação), .fit() requer tanto X quanto y. Para aprendizado não supervisionado (por exemplo, clustering), utilize apenas .fit(X). Passar y não gera erro — ele simplesmente é ignorado.

Durante o treinamento, o modelo aprende padrões necessários para a previsão. O que é aprendido e o tempo de treinamento dependem do algoritmo. O treinamento geralmente é a parte mais lenta do aprendizado de máquina, especialmente com grandes conjuntos de dados.

.predict()

Após o treinamento, utilize .predict() para gerar previsões:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() avalia um modelo treinado, normalmente em um conjunto de teste:

model.fit(X, y)
model.score(X_test, y_test)

Compara as previsões com os verdadeiros alvos. Por padrão, a métrica é acurácia para classificação.

Note
Nota

X_test refere-se ao subconjunto do conjunto de dados, conhecido como conjunto de teste, utilizado para avaliar o desempenho de um modelo após o treinamento. Ele contém as features (dados de entrada). y_test é o subconjunto correspondente de rótulos verdadeiros para X_test. Juntos, eles avaliam o quão bem o modelo prevê novos dados não vistos.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

bookModelos

Deslize para mostrar o menu

Os fundamentos do pré-processamento de dados e da construção de pipelines já foram abordados. O próximo passo é a modelagem.

Um modelo no Scikit-learn é um estimador que fornece os métodos .predict() e .score(), além do .fit() herdado de todos os estimadores.

.fit()

Após o pré-processamento dos dados e estando prontos para o modelo, o primeiro passo na construção de um modelo é o treinamento do modelo. Isso é feito utilizando o .fit(X, y).

Note
Nota

Para aprendizado supervisionado (regressão, classificação), .fit() requer tanto X quanto y. Para aprendizado não supervisionado (por exemplo, clustering), utilize apenas .fit(X). Passar y não gera erro — ele simplesmente é ignorado.

Durante o treinamento, o modelo aprende padrões necessários para a previsão. O que é aprendido e o tempo de treinamento dependem do algoritmo. O treinamento geralmente é a parte mais lenta do aprendizado de máquina, especialmente com grandes conjuntos de dados.

.predict()

Após o treinamento, utilize .predict() para gerar previsões:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() avalia um modelo treinado, normalmente em um conjunto de teste:

model.fit(X, y)
model.score(X_test, y_test)

Compara as previsões com os verdadeiros alvos. Por padrão, a métrica é acurácia para classificação.

Note
Nota

X_test refere-se ao subconjunto do conjunto de dados, conhecido como conjunto de teste, utilizado para avaliar o desempenho de um modelo após o treinamento. Ele contém as features (dados de entrada). y_test é o subconjunto correspondente de rótulos verdadeiros para X_test. Juntos, eles avaliam o quão bem o modelo prevê novos dados não vistos.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1
some-alt