Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Attribute und Inhalte Mehrerer Elemente | Arbeiten mit Elementattributen in Beautiful Soup
Web Scraping mit Python
course content

Kursinhalt

Web Scraping mit Python

Web Scraping mit Python

1. Kennenlernen von HTML
2. HTML mit Beautiful Soup Entschlüsseln
3. Arbeiten mit Elementattributen in Beautiful Soup

book
Attribute und Inhalte Mehrerer Elemente

Alle in dem vorherigen Kapitel behandelten Methoden können auf alle Elemente mit einem bestimmten Tag angewendet werden (d.h., auf das Ergebnis der .find_all() Methode). Es ist jedoch wichtig zu beachten, dass das Ergebnis der Anwendung der .find_all() Methode eine Liste ist, sodass Sie Attribute und Methoden für jedes einzelne Element verwenden müssen. Wie zuvor sollten Sie auch in diesem Kontext eine for-Schleife einsetzen. Zum Beispiel, rufen wir alle Attribute aller <div>-Elemente ab.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Der gleiche Ansatz gilt auch für das Extrahieren von Text. Zum Beispiel, holen wir uns den gesamten Text aller <p>-Elemente.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 3
We're sorry to hear that something went wrong. What happened?
some-alt