Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Navigeren Door HTML-Document | Decoderen van HTML met Beautiful Soup
Web Scraping met Python

bookNavigeren Door HTML-Document

Na het lezen van het HTML-document heb je de flexibiliteit om het op verschillende manieren te navigeren. Om dieper in te gaan, kun je een tag specificeren net als een attribuut. Laten we bijvoorbeeld het <head>-element bekijken en dit in een 'gestructureerde' vorm weergeven (door gebruik te maken van de .prettify()-methode).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

Experimenteer gerust door het .head-attribuut bijvoorbeeld te vervangen door .body. Zoals hierboven weergegeven, bevat het <head>-element meerdere kinderen. Je kunt door alle kinderen van elementen itereren met behulp van een for-lus en het .children-attribuut.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 2

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain what the .prettify() method does?

How can I iterate over the children of the <body> element instead?

What other attributes or methods can I use to navigate the HTML structure?

Awesome!

Completion rate improved to 4.35

bookNavigeren Door HTML-Document

Veeg om het menu te tonen

Na het lezen van het HTML-document heb je de flexibiliteit om het op verschillende manieren te navigeren. Om dieper in te gaan, kun je een tag specificeren net als een attribuut. Laten we bijvoorbeeld het <head>-element bekijken en dit in een 'gestructureerde' vorm weergeven (door gebruik te maken van de .prettify()-methode).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

Experimenteer gerust door het .head-attribuut bijvoorbeeld te vervangen door .body. Zoals hierboven weergegeven, bevat het <head>-element meerdere kinderen. Je kunt door alle kinderen van elementen itereren met behulp van een for-lus en het .children-attribuut.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 2
some-alt