Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Visión General de las Redes Neuronales Artificiales | Fundamentos Teóricos
Modelos Generativos Profundos con Python

Visión General de las Redes Neuronales Artificiales

Desliza para mostrar el menú

Las Redes Neuronales Artificiales (ANNs) constituyen la base de la IA Generativa moderna. Están diseñadas para reconocer patrones, aprender representaciones y generar datos que imitan distribuciones del mundo real. Se presenta una visión concisa y completa de las ANNs, destacando su importancia en la IA Generativa.

Estructura de las Redes Neuronales

Neuronas y Capas

neurona

Una red neuronal consiste en unidades interconectadas llamadas neuronas, que se organizan en capas:

  • Capa de entrada: recibe datos sin procesar (por ejemplo, imágenes, texto, entradas numéricas);
  • Capas ocultas: procesan y transforman los datos utilizando conexiones ponderadas;
  • Capa de salida: genera predicciones o clasificaciones.

Cada neurona aplica una suma ponderada a sus entradas y pasa el resultado a través de una función de activación:

z=i=1nωixi+bz=\sum^n_{i=1}\omega_ix_i+b

donde:

  • xix_i son los valores de entrada;
  • ωi\omega_i son los pesos;
  • bb es el término de sesgo;
  • zz es la suma ponderada que se pasa a la función de activación.

Funciones de activación

Las funciones de activación introducen no linealidad, permitiendo que las redes aprendan patrones complejos. Las funciones de activación más comunes incluyen:

  • Sigmoide, utilizada para probabilidades: σ(z)=11+ez\sigma(z)=\dfrac{1}{1+e^{-z}}
relu
  • ReLU (Unidad Lineal Rectificada), utilizada comúnmente en redes profundas: f(z)=max(0,z)f(z)=\max(0,z)
relu
  • Tanh, útil para salidas centradas en cero: tanh(z)=ezezez+ez\tanh(z)=\dfrac{e^z-e^{-z}}{e^z+e^{-z}}
tanh

Propagación hacia adelante y hacia atrás

Propagación hacia adelante

La propagación hacia adelante se refiere al paso de las entradas a través de la red para calcular la salida. Cada neurona calcula:

a=f(z)=f(i=1nωixi+b)a=f(z)=f\left( \sum^n_{i=1}\omega_i x_i + b \right)

donde f(z)f(z) es la función de activación.

Retropropagación y descenso de gradiente

Para mejorar las predicciones, las RNA ajustan los pesos utilizando retropropagación, que minimiza el error mediante descenso de gradiente. La regla de actualización de pesos en el descenso de gradiente es:

ωi(t+1)=ωi(t)ηLωi\omega^{(t+1)}_i=\omega^{(t)}_i - \eta *\frac{\partial L}{\partial \omega_i}

donde:

  • η\eta es la tasa de aprendizaje;
  • LL es la función de pérdida;
  • Lωi\frac{\partial L}{\partial \omega_i} es el gradiente de la pérdida respecto a ωi\omega_i.

Funciones de pérdida y el proceso de entrenamiento

Funciones de pérdida

Las funciones de pérdida miden la diferencia entre los valores predichos y los valores reales. Las funciones de pérdida comunes incluyen:

  • Error cuadrático medio (MSE) (para regresión):
MSE=1ni=1n(yiy^i2)\text{MSE}=\frac{1}{n}\sum^n_{i=1}(y_i-\hat{y}_i^2)
  • Pérdida de entropía cruzada (para clasificación):
L=i=1nyilog(y^i)\text{L}=-\sum^n_{i=1}y_i\log(\hat{y}_i)

donde:

  • yiy_i es la etiqueta verdadera;
  • y^i\hat{y}_i es la probabilidad predicha.

Proceso de entrenamiento

  1. Inicialización de pesos aleatoriamente;
  2. Realización de propagación hacia adelante para calcular las predicciones;
  3. Cálculo de la pérdida utilizando la función de pérdida seleccionada;
  4. Uso de retropropagación para calcular las actualizaciones de los pesos;
  5. Actualización de los pesos mediante descenso por gradiente;
  6. Repetición durante múltiples épocas hasta que la red converja.

Teorema de aproximación universal y aprendizaje profundo

Teorema de aproximación universal

El Teorema de aproximación universal establece que una red neuronal con al menos una capa oculta puede aproximar cualquier función continua, dado un número suficiente de neuronas y pesos adecuados. Esto justifica por qué las RNA pueden modelar relaciones altamente complejas.

Aprendizaje profundo y su importancia

El aprendizaje profundo amplía las RNA añadiendo muchas capas ocultas, lo que les permite:

  • Extraer características jerárquicas (útil en procesamiento de imágenes y PLN);
  • Modelar distribuciones de probabilidad complejas (crítico para la IA generativa);
  • Aprender sin ingeniería manual de características (como se observa en el aprendizaje auto-supervisado).

Conclusión

Este capítulo presentó los principios fundamentales de las redes neuronales artificiales (ANN), destacando su estructura, proceso de aprendizaje y relevancia en el aprendizaje profundo. Estos conceptos constituyen la base para técnicas avanzadas de IA generativa como GANs y VAEs, que dependen de redes neuronales para generar datos realistas.

1. ¿Cuál de los siguientes NO es un componente de una red neuronal artificial?

2. ¿Cuál es el propósito principal de la retropropagación en las redes neuronales?

3. El Teorema de Aproximación Universal establece que una red neuronal suficientemente grande puede aproximar ¿cuál de las siguientes opciones?

question mark

¿Cuál de los siguientes NO es un componente de una red neuronal artificial?

Selecciona la respuesta correcta

question mark

¿Cuál es el propósito principal de la retropropagación en las redes neuronales?

Selecciona la respuesta correcta

question mark

El Teorema de Aproximación Universal establece que una red neuronal suficientemente grande puede aproximar ¿cuál de las siguientes opciones?

Selecciona la respuesta correcta

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 2. Capítulo 4
some-alt