Anvendelse af Strengmetoder
Hvad kan du gøre med den læste side? Det er en streng, så du kan anvende enhver strengmetode. For eksempel kan du bruge .find()
-metoden, som returnerer indekset for den første forekomst af et specifikt element. For eksempel kan du finde sidetitlen ved at identificere indeksene for de første åbne og lukkede tags. Vi tager også højde for længden af det lukkende tag.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som vist i eksemplet ovenfor blev to variabler, start
og finish
, oprettet. Variablen start
indeholder indekset for det første element inden for den første forekomst af <title>
-elementet. Samtidig indeholder variablen finish
indekset for tegnet umiddelbart efter det lukkende </title>
-tag. .find()
-metoden gav selv det oprindelige indeks for det lukkende tag, så vi lagde længden af tagget til for at opnå indekset for det sidste element.
Listeudsnit udelader det sidste element, hvilket er grunden til, at vi finder det næste tegn efter slutmærket.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you explain how the .find() method works in more detail?
What other string methods can I use to process the web page content?
How can I extract other elements from the HTML using similar techniques?
Awesome!
Completion rate improved to 4.35
Anvendelse af Strengmetoder
Stryg for at vise menuen
Hvad kan du gøre med den læste side? Det er en streng, så du kan anvende enhver strengmetode. For eksempel kan du bruge .find()
-metoden, som returnerer indekset for den første forekomst af et specifikt element. For eksempel kan du finde sidetitlen ved at identificere indeksene for de første åbne og lukkede tags. Vi tager også højde for længden af det lukkende tag.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som vist i eksemplet ovenfor blev to variabler, start
og finish
, oprettet. Variablen start
indeholder indekset for det første element inden for den første forekomst af <title>
-elementet. Samtidig indeholder variablen finish
indekset for tegnet umiddelbart efter det lukkende </title>
-tag. .find()
-metoden gav selv det oprindelige indeks for det lukkende tag, så vi lagde længden af tagget til for at opnå indekset for det sidste element.
Listeudsnit udelader det sidste element, hvilket er grunden til, at vi finder det næste tegn efter slutmærket.
Tak for dine kommentarer!