Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Attributs et Contenus de Plusieurs Éléments | Travail avec les Attributs d’Élément dans Beautiful Soup
Web Scraping avec Python

bookAttributs et Contenus de Plusieurs Éléments

Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées à tous les éléments ayant une balise spécifique (c'est-à-dire au résultat de la méthode .find_all()). Cependant, il est important de garder à l'esprit que le résultat de l'application de la méthode .find_all() est une liste, il faut donc utiliser les attributs et méthodes pour chaque élément individuellement. Comme précédemment, il convient d'utiliser également une boucle for dans ce contexte. Par exemple, récupérons tous les attributs de tous les éléments <div>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

La même approche s'applique à l'extraction du texte. Par exemple, obtenons tout le texte de tous les éléments <p>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 3

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4.35

bookAttributs et Contenus de Plusieurs Éléments

Glissez pour afficher le menu

Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées à tous les éléments ayant une balise spécifique (c'est-à-dire au résultat de la méthode .find_all()). Cependant, il est important de garder à l'esprit que le résultat de l'application de la méthode .find_all() est une liste, il faut donc utiliser les attributs et méthodes pour chaque élément individuellement. Comme précédemment, il convient d'utiliser également une boucle for dans ce contexte. Par exemple, récupérons tous les attributs de tous les éléments <div>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

La même approche s'applique à l'extraction du texte. Par exemple, obtenons tout le texte de tous les éléments <p>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 3
some-alt