Attributs et Contenus de Plusieurs Éléments
Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées à tous les éléments ayant une balise spécifique (c'est-à-dire au résultat de la méthode .find_all()
). Cependant, il est important de garder à l'esprit que le résultat de l'application de la méthode .find_all()
est une liste, il faut donc utiliser les attributs et méthodes pour chaque élément individuellement. Comme précédemment, il convient d'utiliser également une boucle for
dans ce contexte. Par exemple, récupérons tous les attributs de tous les éléments <div>
.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
La même approche s'applique à l'extraction du texte. Par exemple, obtenons tout le texte de tous les éléments <p>
.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 4.35
Attributs et Contenus de Plusieurs Éléments
Glissez pour afficher le menu
Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées à tous les éléments ayant une balise spécifique (c'est-à-dire au résultat de la méthode .find_all()
). Cependant, il est important de garder à l'esprit que le résultat de l'application de la méthode .find_all()
est une liste, il faut donc utiliser les attributs et méthodes pour chaque élément individuellement. Comme précédemment, il convient d'utiliser également une boucle for
dans ce contexte. Par exemple, récupérons tous les attributs de tous les éléments <div>
.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
La même approche s'applique à l'extraction du texte. Par exemple, obtenons tout le texte de tous les éléments <p>
.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Merci pour vos commentaires !