Leer Toepassen van Stringmethoden | Kennismaken met HTML

Wat kun je doen met de pagina die je hebt gelezen? Omdat het een string is, kun je elke stringmethode gebruiken. Bijvoorbeeld, de .find()-methode retourneert de index van het eerste voorkomen van een specifiek element. Je kunt deze gebruiken om de paginatitel te lokaliseren door de indexen van de openings- en sluitende tags te vinden en rekening te houden met de lengte van de sluitende tag.


              1234567891011121314
            
# Importing the module
from urllib.request import urlopen

# Opening web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html"
page = urlopen(url)

# Reading and decoding
web_page = page.read().decode("utf-8")

# Indexes of opening and closing title tags
start = web_page.find("<title")
finish = web_page.find("</title>") + len("</title>")
print(web_page[start:finish])

Zoals getoond in het bovenstaande voorbeeld zijn er twee variabelen aangemaakt, start en finish. De variabele start slaat de index op van het eerste teken binnen de openingstag <title>, terwijl de variabele finish de index opslaat van het teken direct na de sluitende tag </title>. De .find()-methode retourneert de startindex van de sluitende tag, dus de lengte van de tag wordt erbij opgeteld om de uiteindelijke positie te verkrijgen.

Meer Leren

Lijst-slicing sluit het laatste element uit, waardoor het volgende teken na de sluitende tag wordt gebruikt.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 10

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4.35

Veeg om het menu te tonen


              1234567891011121314
            
# Importing the module
from urllib.request import urlopen

# Opening web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html"
page = urlopen(url)

# Reading and decoding
web_page = page.read().decode("utf-8")

# Indexes of opening and closing title tags
start = web_page.find("<title")
finish = web_page.find("</title>") + len("</title>")
print(web_page[start:finish])

Meer Leren

Lijst-slicing sluit het laatste element uit, waardoor het volgende teken na de sluitende tag wordt gebruikt.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 10