Navigazione del Documento HTML
Dopo aver letto il documento HTML, è possibile navigarlo in diversi modi. Per un'analisi più approfondita, è possibile specificare un tag proprio come un attributo. Ad esempio, esaminiamo l'elemento <head>
e rappresentiamolo in una forma 'strutturata' (utilizzando il metodo .prettify()
).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
È possibile sperimentare sostituendo, ad esempio, l'attributo .head
con .body
. Come mostrato sopra, l'elemento <head>
contiene diversi figli. È possibile iterare su tutti i figli degli elementi utilizzando un ciclo for
e l'attributo .children
.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 4.35
Navigazione del Documento HTML
Scorri per mostrare il menu
Dopo aver letto il documento HTML, è possibile navigarlo in diversi modi. Per un'analisi più approfondita, è possibile specificare un tag proprio come un attributo. Ad esempio, esaminiamo l'elemento <head>
e rappresentiamolo in una forma 'strutturata' (utilizzando il metodo .prettify()
).
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
È possibile sperimentare sostituendo, ad esempio, l'attributo .head
con .body
. Come mostrato sopra, l'elemento <head>
contiene diversi figli. È possibile iterare su tutti i figli degli elementi utilizzando un ciclo for
e l'attributo .children
.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Grazie per i tuoi commenti!