Apprendre Attributs et Contenus de Plusieurs Éléments | Travail avec les attributs d’élément dans Beautiful Soup

Glissez pour afficher le menu

Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées aux éléments ayant une balise spécifique, c'est-à-dire au résultat de la méthode .find_all(). Cependant, puisque .find_all() renvoie une liste, il est nécessaire d'accéder séparément aux attributs et méthodes de chaque élément. Utiliser une boucle for à cet effet. Par exemple, récupérer tous les attributs de tous les éléments <div>.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for div in soup.find_all("div"):
  print(div.attrs)

La même approche fonctionne pour extraire le texte. Par exemple, obtenir tout le texte de chaque élément <p>.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for p in soup.find_all("p"):
  print(p.get_text())

Tout était clair ?

Merci pour vos commentaires !

Section 3. Chapitre 3

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 3. Chapitre 3