Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Navigieren Im HTML-Dokument | HTML-Entschlüsselung mit Beautiful Soup
Web Scraping Mit Python

bookNavigieren Im HTML-Dokument

Nach dem Einlesen des HTML-Dokuments besteht die Möglichkeit, dieses auf verschiedene Arten zu navigieren. Um detaillierter vorzugehen, kann ein Tag wie ein Attribut angegeben werden. Beispielsweise lässt sich das <head>-Element untersuchen und in einer 'strukturierten' Form darstellen (mithilfe der Methode .prettify()).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

Es besteht die Möglichkeit, beispielsweise das Attribut .head durch .body zu ersetzen. Wie oben gezeigt, umfasst das <head>-Element mehrere Kindelemente. Alle Kindelemente eines Elements können mit einer for-Schleife und dem Attribut .children durchlaufen werden.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 2

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 4.35

bookNavigieren Im HTML-Dokument

Swipe um das Menü anzuzeigen

Nach dem Einlesen des HTML-Dokuments besteht die Möglichkeit, dieses auf verschiedene Arten zu navigieren. Um detaillierter vorzugehen, kann ein Tag wie ein Attribut angegeben werden. Beispielsweise lässt sich das <head>-Element untersuchen und in einer 'strukturierten' Form darstellen (mithilfe der Methode .prettify()).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

Es besteht die Möglichkeit, beispielsweise das Attribut .head durch .body zu ersetzen. Wie oben gezeigt, umfasst das <head>-Element mehrere Kindelemente. Alle Kindelemente eines Elements können mit einer for-Schleife und dem Attribut .children durchlaufen werden.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 2
some-alt