Navigieren Im HTML-Dokument
Nach dem Einlesen des HTML-Dokuments besteht die Möglichkeit, dieses auf verschiedene Arten zu navigieren. Um detaillierter vorzugehen, kann ein Tag wie ein Attribut angegeben werden. Beispielsweise lässt sich das <head>
-Element untersuchen und in einer 'strukturierten' Form darstellen (mithilfe der Methode .prettify()
).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Es besteht die Möglichkeit, beispielsweise das Attribut .head
durch .body
zu ersetzen. Wie oben gezeigt, umfasst das <head>
-Element mehrere Kindelemente. Alle Kindelemente eines Elements können mit einer for
-Schleife und dem Attribut .children
durchlaufen werden.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4.35
Navigieren Im HTML-Dokument
Swipe um das Menü anzuzeigen
Nach dem Einlesen des HTML-Dokuments besteht die Möglichkeit, dieses auf verschiedene Arten zu navigieren. Um detaillierter vorzugehen, kann ein Tag wie ein Attribut angegeben werden. Beispielsweise lässt sich das <head>
-Element untersuchen und in einer 'strukturierten' Form darstellen (mithilfe der Methode .prettify()
).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Es besteht die Möglichkeit, beispielsweise das Attribut .head
durch .body
zu ersetzen. Wie oben gezeigt, umfasst das <head>
-Element mehrere Kindelemente. Alle Kindelemente eines Elements können mit einer for
-Schleife und dem Attribut .children
durchlaufen werden.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Danke für Ihr Feedback!