Lära Arbeta med Specifika Element | Avkoda HTML med Beautiful Soup

Svep för att visa menyn

Navigering i ett HTML-dokument med Python-attribut hämtar endast den första förekomsten av ett element. För att hitta den första instansen av ett element utan att känna till dess fullständiga sökväg, använd metoden .find() och ange taggnamnet som en sträng (utan < >-parenteser). Till exempel, lokalisera det första <div>-elementet i HTML-dokumentet.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.find("div"))

Du kan även hämta alla instanser av ett specifikt element med metoden .find_all(). Den returnerar en lista med alla träffar. Till exempel, hitta alla <p>-taggar i HTML-dokumentet.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.find_all("p"))

Du kan använda metoden .find_all() för att hitta flera taggar genom att skicka en lista med taggnamn. Till exempel, samla alla <div>- och <title>-element.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/page.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for el in soup.find_all(["div", "title"]):
  print(el)

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 5

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 2. Kapitel 5