Lernen Arbeiten mit Spezifischen Elementen | Decoding HTML With Beautiful Soup

Das Navigieren in einem HTML-Dokument mithilfe von Python-Attributen ruft nur das erste Vorkommen eines Elements ab. Um das erste Vorkommen eines Elements zu finden, ohne den vollständigen Pfad zu kennen, die Methode .find() verwenden und den Tag-Namen als Zeichenkette (ohne < >-Klammern) übergeben. Zum Beispiel das erste <div>-Element im HTML-Dokument lokalisieren.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.find("div"))

Mit der Methode .find_all() können auch alle Instanzen eines bestimmten Elements abgerufen werden. Sie gibt eine Liste aller Übereinstimmungen zurück. Zum Beispiel alle <p>-Tags im HTML-Dokument finden.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.find_all("p"))

Mit der Methode .find_all() können mehrere Tags gefunden werden, indem eine Liste von Tag-Namen übergeben wird. Beispielsweise können alle <div>- und <title>-Elemente gesammelt werden.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/page.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for el in soup.find_all(["div", "title"]):
  print(el)

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 5

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 4.35

Swipe um das Menü anzuzeigen


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.find("div"))


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.find_all("p"))

Mit der Methode .find_all() können mehrere Tags gefunden werden, indem eine Liste von Tag-Namen übergeben wird. Beispielsweise können alle <div>- und <title>-Elemente gesammelt werden.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/page.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for el in soup.find_all(["div", "title"]):
  print(el)

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 5