Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Navigation dans le Document HTML | Décodage du HTML avec Beautiful Soup
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Web Scraping avec Python

bookNavigation dans le Document HTML

Après avoir lu le document HTML, il est possible de le parcourir de différentes manières. Pour l'explorer davantage, spécifiez une balise en tant qu'attribut. Par exemple, examinez l’élément <head> et affichez-le dans un format structuré à l’aide de la méthode .prettify().

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

N'hésitez pas à expérimenter en remplaçant par exemple l’attribut .head par .body. Comme illustré ci-dessus, l’élément <head> comprend plusieurs enfants. Il est possible d’itérer sur tous les enfants des éléments à l’aide d’une boucle for et de l’attribut .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

bookNavigation dans le Document HTML

Glissez pour afficher le menu

Après avoir lu le document HTML, il est possible de le parcourir de différentes manières. Pour l'explorer davantage, spécifiez une balise en tant qu'attribut. Par exemple, examinez l’élément <head> et affichez-le dans un format structuré à l’aide de la méthode .prettify().

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

N'hésitez pas à expérimenter en remplaçant par exemple l’attribut .head par .body. Comme illustré ci-dessus, l’élément <head> comprend plusieurs enfants. Il est possible d’itérer sur tous les enfants des éléments à l’aide d’une boucle for et de l’attribut .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2
some-alt