Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Navigazione del Documento HTML | Decodifica HTML con Beautiful Soup
Web Scraping con Python

bookNavigazione del Documento HTML

Dopo aver letto il documento HTML, è possibile navigarlo in diversi modi. Per un'analisi più approfondita, è possibile specificare un tag proprio come un attributo. Ad esempio, esaminiamo l'elemento <head> e rappresentiamolo in una forma 'strutturata' (utilizzando il metodo .prettify()).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

È possibile sperimentare sostituendo, ad esempio, l'attributo .head con .body. Come mostrato sopra, l'elemento <head> contiene diversi figli. È possibile iterare su tutti i figli degli elementi utilizzando un ciclo for e l'attributo .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 2

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Awesome!

Completion rate improved to 4.35

bookNavigazione del Documento HTML

Scorri per mostrare il menu

Dopo aver letto il documento HTML, è possibile navigarlo in diversi modi. Per un'analisi più approfondita, è possibile specificare un tag proprio come un attributo. Ad esempio, esaminiamo l'elemento <head> e rappresentiamolo in una forma 'strutturata' (utilizzando il metodo .prettify()).

123456789101112
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
copy

È possibile sperimentare sostituendo, ad esempio, l'attributo .head con .body. Come mostrato sopra, l'elemento <head> contiene diversi figli. È possibile iterare su tutti i figli degli elementi utilizzando un ciclo for e l'attributo .children.

1234567891011121314
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
copy

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 2
some-alt