Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Visão Geral das Redes Neurais Artificiais | Fundamentos Teóricos
Modelos Generativos Profundos com Python

Visão Geral das Redes Neurais Artificiais

Deslize para mostrar o menu

Redes Neurais Artificiais (ANNs) como base da IA Generativa moderna. Projetadas para reconhecer padrões, aprender representações e gerar dados que imitam distribuições do mundo real. Visão geral concisa e abrangente das ANNs, com ênfase em sua importância na IA Generativa.

Estrutura das Redes Neurais

Neurônios e Camadas

neurônio

Uma rede neural consiste em unidades interconectadas chamadas neurônios, que são organizadas em camadas:

  • Camada de entrada: recebe dados brutos (por exemplo, imagens, texto, entradas numéricas);
  • Camadas ocultas: processam e transformam os dados utilizando conexões ponderadas;
  • Camada de saída: gera previsões ou classificações.

Cada neurônio aplica uma soma ponderada às suas entradas e passa o resultado por uma função de ativação:

z=i=1nωixi+bz=\sum^n_{i=1}\omega_ix_i+b

onde:

  • xix_i são os valores de entrada;
  • ωi\omega_i são os pesos;
  • bb é o termo de viés;
  • zz é a soma ponderada passada para a função de ativação.

Funções de ativação

Funções de ativação introduzem não linearidade, permitindo que as redes aprendam padrões complexos. Funções de ativação comuns incluem:

  • Sigmoide, utilizada para probabilidades: σ(z)=11+ez\sigma(z)=\dfrac{1}{1+e^{-z}}
relu
  • ReLU (Unidade Linear Retificada), comumente utilizada em redes profundas: f(z)=max(0,z)f(z)=\max(0,z)
relu
  • Tanh, útil para saídas centradas em zero: tanh(z)=ezezez+ez\tanh(z)=\dfrac{e^z-e^{-z}}{e^z+e^{-z}}
tanh

Propagação Direta e Reversa

Propagação Direta

Propagação direta refere-se ao processo de passar as entradas pela rede para calcular a saída. Cada neurônio calcula:

a=f(z)=f(i=1nωixi+b)a=f(z)=f\left( \sum^n_{i=1}\omega_i x_i + b \right)

onde f(z)f(z) é a função de ativação.

Retropropagação e Descenso do Gradiente

Para melhorar as previsões, as RNAs ajustam os pesos utilizando a retropropagação, que minimiza o erro por meio do descenso do gradiente. A regra de atualização dos pesos no descenso do gradiente é:

ωi(t+1)=ωi(t)ηLωi\omega^{(t+1)}_i=\omega^{(t)}_i - \eta *\frac{\partial L}{\partial \omega_i}

onde:

  • η\eta é a taxa de aprendizado;
  • LL é a função de perda;
  • Lωi\frac{\partial L}{\partial \omega_i} é o gradiente da função de perda em relação a ωi\omega_i.

Funções de Perda e o Processo de Treinamento

Funções de Perda

Funções de perda medem a diferença entre os valores previstos e os valores reais. Funções de perda comuns incluem:

  • Erro Quadrático Médio (MSE) (para regressão):
MSE=1ni=1n(yiy^i2)\text{MSE}=\frac{1}{n}\sum^n_{i=1}(y_i-\hat{y}_i^2)
  • Perda de Entropia Cruzada (para classificação):
L=i=1nyilog(y^i)\text{L}=-\sum^n_{i=1}y_i\log(\hat{y}_i)

onde:

  • yiy_i é o rótulo verdadeiro;
  • y^i\hat{y}_i é a probabilidade prevista.

Processo de Treinamento

  1. Inicialização dos pesos aleatoriamente;
  2. Realização da propagação direta para calcular as previsões;
  3. Cálculo da função de perda utilizando a função de perda escolhida;
  4. Utilização da retropropagação para calcular as atualizações dos pesos;
  5. Atualização dos pesos utilizando descida do gradiente;
  6. Repetição por múltiplas épocas até a convergência da rede.

O Teorema da Aproximação Universal e o Deep Learning

Teorema da Aproximação Universal

O Teorema da Aproximação Universal afirma que uma rede neural com pelo menos uma camada oculta pode aproximar qualquer função contínua, desde que haja neurônios suficientes e pesos adequados. Isso justifica por que as RNAs podem modelar relações altamente complexas.

Deep Learning e Sua Importância

Deep Learning expande as RNAs adicionando várias camadas ocultas, permitindo:

  • Extração de características hierárquicas (útil em processamento de imagens e PLN);
  • Modelagem de distribuições de probabilidade complexas (essencial para IA Generativa);
  • Aprendizagem sem engenharia manual de características (como visto em aprendizagem autossupervisionada).

Conclusão

Este capítulo apresentou os princípios fundamentais das Redes Neurais Artificiais (ANNs), destacando sua estrutura, processo de aprendizagem e importância no deep learning. Esses conceitos estabelecem a base para técnicas avançadas de IA Generativa, como GANs e VAEs, que dependem de redes neurais para gerar dados realistas.

1. Qual das alternativas a seguir NÃO é um componente de uma rede neural artificial?

2. Qual é o principal objetivo do backpropagation em redes neurais?

3. O Teorema da Aproximação Universal afirma que uma rede neural suficientemente grande pode aproximar qual das opções a seguir?

question mark

Qual das alternativas a seguir NÃO é um componente de uma rede neural artificial?

Selecione a resposta correta

question mark

Qual é o principal objetivo do backpropagation em redes neurais?

Selecione a resposta correta

question mark

O Teorema da Aproximação Universal afirma que uma rede neural suficientemente grande pode aproximar qual das opções a seguir?

Selecione a resposta correta

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 4

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 2. Capítulo 4
some-alt