Anvendelse av Strengmetoder
Hva kan du gjøre med siden du har lest? Siden det er en streng, kan du bruke alle strengmetoder. For eksempel returnerer .find()-metoden indeksen til den første forekomsten av et spesifikt element. Du kan bruke den til å finne sidetittelen ved å finne indeksene til åpnings- og lukketaggene og ta hensyn til lengden på lukketaggen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som vist i eksempelet over, ble to variabler, start og finish, opprettet. Variabelen start lagrer indeksen til det første tegnet innenfor åpnings-<title>-taggen, mens variabelen finish lagrer indeksen til tegnet rett etter lukkende </title>-tagg. .find()-metoden returnerer startindeksen til lukketaggen, så taggens lengde legges til for å få den endelige posisjonen.
Listeslicing utelater det siste elementet, derfor brukes tegnet etter avslutningstagen.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain how the .find() method works in more detail?
What other string methods can I use to process the web page content?
Can you show how to extract just the text inside the <title> tags?
Awesome!
Completion rate improved to 4.35
Anvendelse av Strengmetoder
Sveip for å vise menyen
Hva kan du gjøre med siden du har lest? Siden det er en streng, kan du bruke alle strengmetoder. For eksempel returnerer .find()-metoden indeksen til den første forekomsten av et spesifikt element. Du kan bruke den til å finne sidetittelen ved å finne indeksene til åpnings- og lukketaggene og ta hensyn til lengden på lukketaggen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Som vist i eksempelet over, ble to variabler, start og finish, opprettet. Variabelen start lagrer indeksen til det første tegnet innenfor åpnings-<title>-taggen, mens variabelen finish lagrer indeksen til tegnet rett etter lukkende </title>-tagg. .find()-metoden returnerer startindeksen til lukketaggen, så taggens lengde legges til for å få den endelige posisjonen.
Listeslicing utelater det siste elementet, derfor brukes tegnet etter avslutningstagen.
Takk for tilbakemeldingene dine!