Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Attributs et Contenus de Plusieurs Éléments | Travail avec les Attributs d’Élément dans Beautiful Soup
Web Scraping avec Python

bookAttributs et Contenus de Plusieurs Éléments

Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées aux éléments ayant une balise spécifique, c'est-à-dire au résultat de la méthode .find_all(). Cependant, comme .find_all() retourne une liste, il est nécessaire d'accéder séparément aux attributs et méthodes de chaque élément. Utiliser une boucle for à cet effet. Par exemple, récupérer tous les attributs de tous les éléments <div>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

La même approche fonctionne pour extraire le texte. Par exemple, obtenir tout le texte de chaque élément <p>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 3

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain how the `.attrs` attribute works in BeautifulSoup?

What other tags can I use with `.find_all()` besides `<div>` and `<p>`?

How can I filter elements by class or id using BeautifulSoup?

Awesome!

Completion rate improved to 4.35

bookAttributs et Contenus de Plusieurs Éléments

Glissez pour afficher le menu

Toutes les méthodes abordées dans le chapitre précédent peuvent être appliquées aux éléments ayant une balise spécifique, c'est-à-dire au résultat de la méthode .find_all(). Cependant, comme .find_all() retourne une liste, il est nécessaire d'accéder séparément aux attributs et méthodes de chaque élément. Utiliser une boucle for à cet effet. Par exemple, récupérer tous les attributs de tous les éléments <div>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

La même approche fonctionne pour extraire le texte. Par exemple, obtenir tout le texte de chaque élément <p>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 3
some-alt