Anvendelse av Strengmetoder
Hva kan du gjøre med den leste siden? Det er en streng, så du kan benytte alle strengmetoder. For eksempel kan du bruke .find()
-metoden, som returnerer indeksen til den første forekomsten av et spesifikt element. For eksempel kan du finne sidetittelen ved å identifisere indeksene til de første åpne- og lukketaggene. Vi tar også hensyn til lengden på lukketaggen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som vist i eksempelet ovenfor, ble to variabler, start
og finish
, opprettet. Variabelen start
inneholder indeksen til det første elementet innenfor den første forekomsten av <title>
-elementet. Samtidig inneholder variabelen finish
indeksen til tegnet umiddelbart etter den avsluttende </title>
-taggen. .find()
-metoden ga selv den første indeksen til lukketaggen, så vi la til lengden på taggen for å få indeksen til det siste elementet.
Listeslicing utelater det siste elementet, derfor finner vi neste tegn etter avslutningstagen.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain how the .find() method works in more detail?
What other string methods can I use to process the web page content?
How can I extract other elements from the HTML using similar techniques?
Awesome!
Completion rate improved to 4.35
Anvendelse av Strengmetoder
Sveip for å vise menyen
Hva kan du gjøre med den leste siden? Det er en streng, så du kan benytte alle strengmetoder. For eksempel kan du bruke .find()
-metoden, som returnerer indeksen til den første forekomsten av et spesifikt element. For eksempel kan du finne sidetittelen ved å identifisere indeksene til de første åpne- og lukketaggene. Vi tar også hensyn til lengden på lukketaggen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som vist i eksempelet ovenfor, ble to variabler, start
og finish
, opprettet. Variabelen start
inneholder indeksen til det første elementet innenfor den første forekomsten av <title>
-elementet. Samtidig inneholder variabelen finish
indeksen til tegnet umiddelbart etter den avsluttende </title>
-taggen. .find()
-metoden ga selv den første indeksen til lukketaggen, så vi la til lengden på taggen for å få indeksen til det siste elementet.
Listeslicing utelater det siste elementet, derfor finner vi neste tegn etter avslutningstagen.
Takk for tilbakemeldingene dine!