Navigering i HTML-dokument
Efter at have læst HTML-dokumentet, har du fleksibilitet til at navigere på flere måder. For at undersøge nærmere kan du specificere et tag ligesom en attribut. For eksempel kan vi undersøge <head>
-elementet og repræsentere det i en 'struktureret' form (ved at anvende .prettify()
-metoden).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Du kan eksperimentere ved at erstatte .head
-attributten med for eksempel .body
. Som vist ovenfor indeholder <head>
-elementet flere underordnede elementer. Du kan iterere gennem alle elementernes underordnede ved hjælp af en for
-løkke og .children
-attributten.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 4.35
Navigering i HTML-dokument
Stryg for at vise menuen
Efter at have læst HTML-dokumentet, har du fleksibilitet til at navigere på flere måder. For at undersøge nærmere kan du specificere et tag ligesom en attribut. For eksempel kan vi undersøge <head>
-elementet og repræsentere det i en 'struktureret' form (ved at anvende .prettify()
-metoden).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Du kan eksperimentere ved at erstatte .head
-attributten med for eksempel .body
. Som vist ovenfor indeholder <head>
-elementet flere underordnede elementer. Du kan iterere gennem alle elementernes underordnede ved hjælp af en for
-løkke og .children
-attributten.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Tak for dine kommentarer!