Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Navigation dans le Document HTML | Décodage du HTML avec Beautiful Soup
Web Scraping avec Python

bookNavigation dans le Document HTML

Après avoir lu le document HTML, vous disposez de la flexibilité nécessaire pour le parcourir de plusieurs manières. Pour approfondir, il est possible de spécifier une balise comme un attribut. Par exemple, examinons l’élément <head> et représentons-le sous une forme « structurée » (en utilisant la méthode .prettify()).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

N’hésitez pas à expérimenter en remplaçant l’attribut .head par .body, par exemple. Comme illustré ci-dessus, l’élément <head> comprend plusieurs enfants. Il est possible d’itérer sur tous les enfants des éléments à l’aide d’une boucle for et de l’attribut .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4.35

bookNavigation dans le Document HTML

Glissez pour afficher le menu

Après avoir lu le document HTML, vous disposez de la flexibilité nécessaire pour le parcourir de plusieurs manières. Pour approfondir, il est possible de spécifier une balise comme un attribut. Par exemple, examinons l’élément <head> et représentons-le sous une forme « structurée » (en utilisant la méthode .prettify()).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

N’hésitez pas à expérimenter en remplaçant l’attribut .head par .body, par exemple. Comme illustré ci-dessus, l’élément <head> comprend plusieurs enfants. Il est possible d’itérer sur tous les enfants des éléments à l’aide d’une boucle for et de l’attribut .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2
some-alt