Lære Navigering i HTML-dokument | Afkodning af HTML med Beautiful Soup

Stryg for at vise menuen

Efter at have læst HTML-dokumentet, kan du navigere det på forskellige måder. For at udforske det yderligere, angiv en tag som en attribut. For eksempel kan du undersøge <head>-elementet og vise det i et struktureret format ved hjælp af .prettify()-metoden.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.head.prettify())

Du kan eksperimentere ved at erstatte .head-attributten med for eksempel .body. Som vist ovenfor indeholder <head>-elementet flere underordnede elementer. Du kan iterere gennem alle elementernes underordnede ved hjælp af en for-løkke og .children-attributten.


              1234567891011121314
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
# Iterating over all element children
for child in soup.head.children:
  print(child)

Var alt klart?

Tak for dine kommentarer!

Sektion 2. Kapitel 2

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 2. Kapitel 2