Använda Strängmetoder
Vad kan du göra med den lästa sidan? Det är en sträng, så du kan använda alla strängmetoder. Till exempel kan du använda metoden .find()
, som returnerar indexet för den första förekomsten av ett specifikt element. Du kan till exempel hitta sidans titel genom att identifiera indexen för de första öppnings- och stängningstagarna. Vi tar även hänsyn till längden på stängningstaggen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som visas i exemplet ovan skapades två variabler, start
och finish
. Variabeln start
innehåller indexet för det första elementet inom den första förekomsten av <title>
-elementet. Samtidigt innehåller variabeln finish
indexet för tecknet omedelbart efter den avslutande </title>
-taggen. Metoden .find()
gav i sig det initiala indexet för stängningstaggen, så vi lade till längden på taggen för att få indexet för det sista elementet.
Listuppdelning utesluter det sista elementet, vilket är anledningen till att vi letar efter nästa tecken efter sluttaggen.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you explain how the .find() method works in more detail?
What other string methods can I use to process the web page content?
How can I extract other elements from the HTML using similar techniques?
Awesome!
Completion rate improved to 4.35
Använda Strängmetoder
Svep för att visa menyn
Vad kan du göra med den lästa sidan? Det är en sträng, så du kan använda alla strängmetoder. Till exempel kan du använda metoden .find()
, som returnerar indexet för den första förekomsten av ett specifikt element. Du kan till exempel hitta sidans titel genom att identifiera indexen för de första öppnings- och stängningstagarna. Vi tar även hänsyn till längden på stängningstaggen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som visas i exemplet ovan skapades två variabler, start
och finish
. Variabeln start
innehåller indexet för det första elementet inom den första förekomsten av <title>
-elementet. Samtidigt innehåller variabeln finish
indexet för tecknet omedelbart efter den avslutande </title>
-taggen. Metoden .find()
gav i sig det initiala indexet för stängningstaggen, så vi lade till längden på taggen för att få indexet för det sista elementet.
Listuppdelning utesluter det sista elementet, vilket är anledningen till att vi letar efter nästa tecken efter sluttaggen.
Tack för dina kommentarer!