Attributs et Contenus de Plusieurs Éléments
Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées aux éléments ayant une balise spécifique, c'est-à-dire au résultat de la méthode .find_all(). Cependant, comme .find_all() retourne une liste, il est nécessaire d'accéder séparément aux attributs et méthodes de chaque élément. Utiliser une boucle for à cet effet. Par exemple, récupérer tous les attributs de tous les éléments <div>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
La même approche fonctionne pour extraire le texte. Par exemple, obtenir tout le texte de chaque élément <p>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain how the `.attrs` attribute works in BeautifulSoup?
What other tags can I use with `.find_all()` besides `<div>` and `<p>`?
How can I filter elements by class or id using BeautifulSoup?
Awesome!
Completion rate improved to 4.35
Attributs et Contenus de Plusieurs Éléments
Glissez pour afficher le menu
Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées aux éléments ayant une balise spécifique, c'est-à-dire au résultat de la méthode .find_all(). Cependant, comme .find_all() retourne une liste, il est nécessaire d'accéder séparément aux attributs et méthodes de chaque élément. Utiliser une boucle for à cet effet. Par exemple, récupérer tous les attributs de tous les éléments <div>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
La même approche fonctionne pour extraire le texte. Par exemple, obtenir tout le texte de chaque élément <p>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Merci pour vos commentaires !