Summary  
This chapter explains how to implement a multilayer perceptron neural network, covering neuron structure with weights and biases, activation functions, forward propagation, backpropagation via gradient descent, and model evaluation metrics.  

General domain of usage  
Image recognition

## Concepto de una Red Neuronal

Una **neurona** es la unidad fundamental de procesamiento de información en una red neuronal. Recibe entradas, las procesa y produce una salida.  

Cada entrada a una neurona tiene un **peso**, que determina su importancia en el cálculo. El **sesgo** es un parámetro adicional que ayuda a desplazar la salida de la neurona, proporcionando flexibilidad para aprender patrones.  


El **entrenamiento de una red neuronal** consiste en ajustar estos pesos y sesgos para minimizar los errores y mejorar la precisión.  

La **función de activación** transforma la suma de las entradas ponderadas en la salida de la neurona. Las funciones de activación más comunes incluyen:  
1. **Función sigmoide**: produce valores entre 0 y 1, útil para clasificación binaria;  
2. **ReLU (Unidad Lineal Rectificada)**: ayuda a entrenar redes profundas de manera eficiente;  
3. **Tangente hiperbólica (tanh)**: produce valores entre -1 y 1, útil para datos centrados en cero.  

Durante la **propagación hacia adelante**, la información fluye desde la **capa de entrada** a través de las **capas ocultas** hasta la **capa de salida**, donde se realiza una predicción o inferencia.

Para mejorar las predicciones, se utiliza la **retropropagación**. Este proceso propaga la información del error hacia atrás a través de la red, ajustando los pesos para reducir los errores.  



## Construcción de una Red Neuronal desde Cero  

Un **perceptrón multicapa (MLP)** consta de varias capas:  
1. **Capa de entrada**: recibe los datos de entrada;  
2. **Capas ocultas**: procesan los datos y extraen patrones;  
3. **Capa de salida**: produce la predicción o clasificación final.  

Cada capa contiene múltiples neuronas, y la salida de una capa sirve como entrada para la siguiente.   

La **retropropagación** consiste en la propagación hacia adelante, el cálculo del error, el cálculo del gradiente y el ajuste de los pesos y sesgos.  

La **tasa de aprendizaje** es un parámetro clave en el **descenso de gradiente**, que controla cuánto se actualizan los pesos durante el entrenamiento. Una tasa de aprendizaje alta **acelera el entrenamiento** pero puede hacer que el modelo pase por alto patrones importantes, mientras que una tasa de aprendizaje baja asegura un **aprendizaje más preciso** pero puede ralentizar la convergencia.  

Existen varias formas de **evaluar el rendimiento de un modelo**, incluyendo:  
- **Precisión**: mide el porcentaje de predicciones correctas;  
- **Error cuadrático medio (MSE)**: evalúa el error en tareas de regresión;  
- **Entropía cruzada**: utilizada comúnmente en problemas de clasificación.

## Implementación de una Red Neuronal usando Scikit-Learn  

El primer paso es crear un modelo:

```python
from sklearn.neural_network import MLPClassifier

model = MLPClassifier(max_iter=200, hidden_layer_sizes=(10, 20, 30), learning_rate_init=0.01)
```
Una vez creado el modelo, debe entrenarse con el conjunto de entrenamiento:
 
```python
model.fit(X_train, y_train)
```

Finalmente, se pueden realizar predicciones, por ejemplo, sobre un conjunto de prueba:  
```python
y_pred = model.predict(X_test)
```



## Conclusión  

Al elegir entre **modelos tradicionales** y **redes neuronales**, considerar el tamaño del conjunto de datos, la complejidad del problema y la interpretabilidad.

Los tipos comunes de redes neuronales son los siguientes:

Bibliotecas populares de deep learning:

- **TensorFlow**: framework de deep learning de Google para aprendizaje automático escalable;  
- **PyTorch**: biblioteca de deep learning flexible y dinámica, ampliamente utilizada en investigación y producción.  

Las redes neuronales son algoritmos potentes inspirados en la estructura del cerebro humano que se utilizan para resolver problemas complejos de aprendizaje automático. Construirá su propia red neuronal desde cero para comprender su funcionamiento. Tras este curso, podrá crear redes neuronales para resolver problemas de clasificación y regresión utilizando la biblioteca scikit-learn.

Primero, discutiremos qué es una red neuronal y cómo funciona. También se considerará el alcance de su aplicación.

A continuación, intentaremos construir nuestra propia red neuronal y evaluaremos su eficiencia en el aprendizaje. También analizaremos una solución ya implementada de la biblioteca scikit-learn.

Finalmente, le proporcionaremos información adicional útil sobre cómo determinar qué modelo utilizar y qué tipos de redes neuronales existen. Para completar el curso, se evaluarán los conocimientos adquiridos.

Resumen

Concepto de una Red Neuronal

Construcción de una Red Neuronal desde Cero

Implementación de una Red Neuronal usando Scikit-Learn

Conclusión