Scorri per mostrare il menu

Cosa puoi fare con la pagina che hai letto? Poiché si tratta di una stringa, puoi utilizzare qualsiasi metodo delle stringhe. Ad esempio, il metodo .find() restituisce l'indice della prima occorrenza di un elemento specifico. Puoi usarlo per individuare il titolo della pagina trovando gli indici dei tag di apertura e chiusura e considerando la lunghezza del tag di chiusura.


              1234567891011121314
            
# Importing the module
from urllib.request import urlopen

# Opening web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html"
page = urlopen(url)

# Reading and decoding
web_page = page.read().decode("utf-8")

# Indexes of opening and closing title tags
start = web_page.find("<title")
finish = web_page.find("</title>") + len("</title>")
print(web_page[start:finish])

Come mostrato nell'esempio sopra, sono state create due variabili, start e finish. La variabile start memorizza l'indice del primo carattere all'interno del tag di apertura <title>, mentre la variabile finish memorizza l'indice del carattere subito dopo il tag di chiusura </title>. Il metodo .find() restituisce l'indice iniziale del tag di chiusura, quindi viene aggiunta la lunghezza del tag per ottenere la posizione finale.

Approfondimento

Il slicing delle liste esclude l'ultimo elemento, motivo per cui viene utilizzato il carattere successivo al tag di chiusura.

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 10

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Applicazione dei Metodi delle Stringhe


              1234567891011121314
            
# Importing the module
from urllib.request import urlopen

# Opening web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html"
page = urlopen(url)

# Reading and decoding
web_page = page.read().decode("utf-8")

# Indexes of opening and closing title tags
start = web_page.find("<title")
finish = web_page.find("</title>") + len("</title>")
print(web_page[start:finish])

Approfondimento

Il slicing delle liste esclude l'ultimo elemento, motivo per cui viene utilizzato il carattere successivo al tag di chiusura.

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 10