Navigera HTML-dokument
Efter att ha läst in HTML-dokumentet har du flexibiliteten att navigera det på flera sätt. För att undersöka djupare kan du specificera en tagg precis som en attribut. Till exempel, låt oss granska <head>
-elementet och representera det i en 'strukturerad' form (genom att använda metoden .prettify()
).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Prova gärna att byta ut attributet .head
mot .body
, till exempel. Som visas ovan innehåller <head>
-elementet flera barn. Du kan iterera genom alla barns element med hjälp av en for
-loop och attributet .children
.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 4.35
Navigera HTML-dokument
Svep för att visa menyn
Efter att ha läst in HTML-dokumentet har du flexibiliteten att navigera det på flera sätt. För att undersöka djupare kan du specificera en tagg precis som en attribut. Till exempel, låt oss granska <head>
-elementet och representera det i en 'strukturerad' form (genom att använda metoden .prettify()
).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Prova gärna att byta ut attributet .head
mot .body
, till exempel. Som visas ovan innehåller <head>
-elementet flera barn. Du kan iterera genom alla barns element med hjälp av en for
-loop och attributet .children
.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Tack för dina kommentarer!