Contenu du cours
Automatisation de la Collecte de Données à Partir de Sources Web
Automatisation de la Collecte de Données à Partir de Sources Web
Analyser le Contenu HTML en Utilisant BeautifulSoup
BeautifulSoup
est une bibliothèque Python utilisée pour analyser les documents HTML et XML. Elle crée des arbres d'analyse qui sont utiles pour extraire facilement les données. Elle repose sur un analyseur HTML ou XML, fournissant des idiomes Pythonic pour itérer, rechercher et modifier l'arbre d'analyse.
Voici un exemple de comment utiliser BeautifulSoup
pour analyser un document HTML et extraire certaines données :
Tâche
Swipe to start coding
- Importez la bibliothèque
BeautifulSoup
. - Utilisez la bibliothèque
BeautifulSoup
pour analyser le contenu du site web (html
). - Imprimez la variable.
Solution
Mark tasks as Completed
Tout était clair ?
Merci pour vos commentaires !
Section 1. Chapitre 3
AVAILABLE TO ULTIMATE ONLY