Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Anvendelse av Strengmetoder | Bli Kjent med HTML
Webskraping med Python

bookAnvendelse av Strengmetoder

Hva kan du gjøre med siden du har lest? Siden det er en streng, kan du bruke alle strengmetoder. For eksempel returnerer .find()-metoden indeksen til den første forekomsten av et spesifikt element. Du kan bruke den til å finne sidetittelen ved å finne indeksene til åpnings- og lukketaggene og ta hensyn til lengden på lukketaggen.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Som vist i eksempelet over, ble to variabler, start og finish, opprettet. Variabelen start lagrer indeksen til det første tegnet innenfor åpnings-<title>-taggen, mens variabelen finish lagrer indeksen til tegnet rett etter lukkende </title>-tagg. .find()-metoden returnerer startindeksen til lukketaggen, så taggens lengde legges til for å få den endelige posisjonen.

Note
Les mer

Listeslicing utelater det siste elementet, derfor brukes tegnet etter avslutningstagen.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain how the .find() method works in more detail?

What other string methods can I use to process the web page content?

Can you show how to extract just the text inside the <title> tags?

Awesome!

Completion rate improved to 4.35

bookAnvendelse av Strengmetoder

Sveip for å vise menyen

Hva kan du gjøre med siden du har lest? Siden det er en streng, kan du bruke alle strengmetoder. For eksempel returnerer .find()-metoden indeksen til den første forekomsten av et spesifikt element. Du kan bruke den til å finne sidetittelen ved å finne indeksene til åpnings- og lukketaggene og ta hensyn til lengden på lukketaggen.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Som vist i eksempelet over, ble to variabler, start og finish, opprettet. Variabelen start lagrer indeksen til det første tegnet innenfor åpnings-<title>-taggen, mens variabelen finish lagrer indeksen til tegnet rett etter lukkende </title>-tagg. .find()-metoden returnerer startindeksen til lukketaggen, så taggens lengde legges til for å få den endelige posisjonen.

Note
Les mer

Listeslicing utelater det siste elementet, derfor brukes tegnet etter avslutningstagen.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10
some-alt