Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Introduction au Web Scraping | Découverte de HTML
Web Scraping avec Python

bookIntroduction au Web Scraping

Bienvenue dans le cours ! Aujourd'hui, une première exploration du fonctionnement de l’extraction de données web.

Note
Définition

Extraction de données web : processus permettant d’extraire automatiquement des informations à partir de sites web. Par exemple, il est possible de l’utiliser pour comparer les prix sur différentes plateformes ou collecter des données boursières.

Il existe de nombreuses méthodes en Python pour extraire des données. Comparons les bibliothèques les plus populaires pour le web scraping : requests, BeautifulSoup, lxml et Selenium.

Tout au long de ce cours, nous nous concentrerons principalement sur les deux premières bibliothèques. Cependant, il convient de noter que selenium et lxml sont des outils extrêmement puissants :

  • Selenium permet la prise en charge de JavaScript, un langage de programmation qui permet aux développeurs d'interagir avec des champs et des menus dynamiques ;
  • lxml facilite le travail avec les fichiers HTML et XML.
question mark

Sélectionner l'énoncé correct.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 1

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain the main differences between these libraries?

Which library should I use for a beginner project?

Why is JavaScript support important in web scraping?

Awesome!

Completion rate improved to 4.35

bookIntroduction au Web Scraping

Glissez pour afficher le menu

Bienvenue dans le cours ! Aujourd'hui, une première exploration du fonctionnement de l’extraction de données web.

Note
Définition

Extraction de données web : processus permettant d’extraire automatiquement des informations à partir de sites web. Par exemple, il est possible de l’utiliser pour comparer les prix sur différentes plateformes ou collecter des données boursières.

Il existe de nombreuses méthodes en Python pour extraire des données. Comparons les bibliothèques les plus populaires pour le web scraping : requests, BeautifulSoup, lxml et Selenium.

Tout au long de ce cours, nous nous concentrerons principalement sur les deux premières bibliothèques. Cependant, il convient de noter que selenium et lxml sont des outils extrêmement puissants :

  • Selenium permet la prise en charge de JavaScript, un langage de programmation qui permet aux développeurs d'interagir avec des champs et des menus dynamiques ;
  • lxml facilite le travail avec les fichiers HTML et XML.
question mark

Sélectionner l'énoncé correct.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 1
some-alt