Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Navigation dans un Document HTML | Décodage du HTML avec Beautiful Soup
Web Scraping avec Python

bookNavigation dans un Document HTML

Après avoir lu le document HTML, il est possible de le parcourir de différentes manières. Pour l'explorer davantage, spécifiez une balise en tant qu'attribut. Par exemple, examinez l’élément <head> et affichez-le dans un format structuré à l’aide de la méthode .prettify().

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

N'hésitez pas à expérimenter en remplaçant par exemple l'attribut .head par .body. Comme illustré ci-dessus, l’élément <head> comprend plusieurs enfants. Il est possible d’itérer sur tous les enfants des éléments à l’aide d’une boucle for et de l’attribut .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain what the `.children` attribute does in BeautifulSoup?

How can I access other elements besides `<head>` using BeautifulSoup?

What is the difference between `.children` and `.contents` in BeautifulSoup?

Awesome!

Completion rate improved to 4.35

bookNavigation dans un Document HTML

Glissez pour afficher le menu

Après avoir lu le document HTML, il est possible de le parcourir de différentes manières. Pour l'explorer davantage, spécifiez une balise en tant qu'attribut. Par exemple, examinez l’élément <head> et affichez-le dans un format structuré à l’aide de la méthode .prettify().

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

N'hésitez pas à expérimenter en remplaçant par exemple l'attribut .head par .body. Comme illustré ci-dessus, l’élément <head> comprend plusieurs enfants. Il est possible d’itérer sur tous les enfants des éléments à l’aide d’une boucle for et de l’attribut .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2
some-alt