Aprenda Guia Prático do Modelo ML no BigQuery | Machine Learning no BigQuery

Deslize para mostrar o menu

Descubra o ciclo de vida completo de um modelo de machine learning, desde a preparação dos dados até a interpretação dos resultados para as partes interessadas. Construa e avalie um modelo de regressão linear diretamente no BigQuery.

Preparação de Dados e Design de Esquema

Antes de iniciar a modelagem, é necessário definir onde os dados estão armazenados e como estão estruturados:

Criação de esquema: definir nomes de colunas e tipos de dados para garantir que os dados possam ser carregados e consultados corretamente;
Carregamento e inspeção de dados: utilizar pequenos conjuntos de dados para observar correlações iniciais, como a influência do número de quartos no preço das casas;
Compreensão de correlações: combinar múltiplos atributos para identificar relações preditivas fortes necessárias para aplicações reais.

Treinamento e Lógica do Modelo

O aprendizado de máquina envolve ensinar um modelo a reconhecer relações matemáticas entre entradas e saídas:

Seleção de modelo: utilizar regressão linear para prever resultados numéricos contínuos;
Definição de variáveis: definir a variável alvo (por exemplo, preço) e os atributos de entrada (por exemplo, metragem quadrada e número de quartos);
Processo de aprendizado: o treinamento ocorre em iterações, onde o modelo se ajusta com base na taxa de aprendizado para minimizar a perda (erro quadrático médio).

Avaliação e Validação

Para garantir que o modelo esteja realmente aprendendo e não apenas memorizando, é necessário validar seu desempenho:

Divisão de treino e avaliação: reservar aproximadamente 20 por cento dos dados para testar o modelo em exemplos não vistos;
Métricas de avaliação do modelo: utilizar (R-quadrado) para medir o poder preditivo, onde valores acima de 0,8 geralmente indicam uma base sólida;
Comparação de valores: analisar o erro percentual entre os valores previstos e reais para confirmar a precisão do modelo.

Geração de Previsões e Interpretação

O objetivo final é gerar insights acionáveis a partir de novos dados:

Geração de previsões: aplicar o modelo treinado a novos registros não vistos para simular o uso em situações reais;
Interpretação dos pesos: examinar os pesos dos atributos para determinar quais entradas, como o número de quartos, têm maior influência na previsão final;
Interceptações de base: identificar a interceptação para compreender a previsão base quando todos os atributos de entrada são zero.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 6. Capítulo 3

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 6. Capítulo 3