Attributs et Contenus de Plusieurs Éléments
Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées aux éléments ayant une balise spécifique, c'est-à-dire au résultat de la méthode .find_all(). Cependant, puisque .find_all() renvoie une liste, il est nécessaire d'accéder séparément aux attributs et méthodes de chaque élément. Utiliser une boucle for à cet effet. Par exemple, récupérer tous les attributs de tous les éléments <div>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
La même approche fonctionne pour extraire le texte. Par exemple, obtenir tout le texte de chaque élément <p>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 4.35
Attributs et Contenus de Plusieurs Éléments
Glissez pour afficher le menu
Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées aux éléments ayant une balise spécifique, c'est-à-dire au résultat de la méthode .find_all(). Cependant, puisque .find_all() renvoie une liste, il est nécessaire d'accéder séparément aux attributs et méthodes de chaque élément. Utiliser une boucle for à cet effet. Par exemple, récupérer tous les attributs de tous les éléments <div>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
La même approche fonctionne pour extraire le texte. Par exemple, obtenir tout le texte de chaque élément <p>.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Merci pour vos commentaires !