Oppiskele HTML-Dokumentin Navigointi | HTML:n Purkaminen Beautiful Soupilla

Pyyhkäise näyttääksesi valikon

Kun HTML-dokumentti on luettu, sitä voidaan navigoida eri tavoin. Tutkiaksesi sitä tarkemmin, määritä tunniste attribuuttina. Esimerkiksi tarkastele <head>-elementtiä ja näytä se jäsennellyssä muodossa käyttämällä .prettify()-metodia.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.head.prettify())

Voit kokeilla korvaamalla esimerkiksi .head-attribuutin .body:lla. Kuten yllä on esitetty, <head>-elementti sisältää useita lapsielementtejä. Voit käydä läpi kaikkia elementin lapsia käyttämällä for-silmukkaa ja .children-attribuuttia.


              1234567891011121314
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
# Iterating over all element children
for child in soup.head.children:
  print(child)

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 2. Luku 2

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 2. Luku 2