Summary
This chapter demonstrates how to use Python libraries for making HTTP requests and parsing HTML documents, as well as how to handle dynamic content via browser automation.

General domain of usage
Web scraping

¡Bienvenido al curso! Hoy comenzarás a explorar cómo funciona el **web scraping**.


**Web Scraping** es un proceso utilizado para extraer información automáticamente de sitios web. Por ejemplo, puedes emplearlo para comparar precios en varias plataformas o recopilar datos sobre acciones.

Definición

Existen numerosos métodos en Python para extraer datos. Comparemos las bibliotecas más populares para web scraping: `requests`, `BeautifulSoup`, `lxml` y `Selenium`.

A lo largo de este curso, el enfoque principal será en las dos primeras bibliotecas. Sin embargo, `selenium` y `lxml` también son herramientas potentes:

* `selenium` permite soporte para **JavaScript**, facilitando la interacción con campos y menús dinámicos;
* `lxml` simplifica el trabajo tanto con archivos **HTML** como **XML**.


Aprenda a extraer datos valiosos de sitios web de forma automática. Domine técnicas para recopilar información de manera eficiente, permitiendo realizar análisis en profundidad, tomar decisiones basadas en datos y descubrir nuevos conocimientos a partir del vasto océano de información en línea.

Explora la estructura de un archivo HTML, aprende a cargarlo de manera eficiente y adquiere habilidades prácticas para trabajar con los datos que contiene.

Explora los conceptos básicos de Beautiful Soup para extraer datos de documentos HTML. Aprende a navegar por la estructura de HTML, acceder a elementos específicos y trabajar con sus elementos secundarios para construir una base sólida en web scraping.

Domine el trabajo con atributos y contenido de elementos utilizando Beautiful Soup. Adquiera las habilidades para extraer información específica, buscar elementos por valores de atributos y emplear técnicas avanzadas para analizar y procesar datos HTML de manera eficiente.

Introducción a la Extracción Web