Lernen Navigieren im HTML-Dokument | Decoding HTML With Beautiful Soup

Swipe um das Menü anzuzeigen

Nach dem Einlesen des HTML-Dokuments kann dieses auf verschiedene Arten navigiert werden. Um es weiter zu untersuchen, kann ein Tag als Attribut angegeben werden. Beispielsweise kann das <head>-Element betrachtet und mit der Methode .prettify() in einem strukturierten Format ausgegeben werden.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.head.prettify())

Es kann beispielsweise auch das Attribut .head durch .body ersetzt werden. Wie oben gezeigt, umfasst das <head>-Element mehrere Kindelemente. Alle Kindelemente eines Elements können mit einer for-Schleife und dem Attribut .children durchlaufen werden.


              1234567891011121314
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
# Iterating over all element children
for child in soup.head.children:
  print(child)

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 2

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 2. Kapitel 2