Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Anvendelse av Strengmetoder | Bli Kjent med HTML
Webskraping med Python

bookAnvendelse av Strengmetoder

Hva kan du gjøre med den leste siden? Det er en streng, så du kan benytte alle strengmetoder. For eksempel kan du bruke .find()-metoden, som returnerer indeksen til den første forekomsten av et spesifikt element. For eksempel kan du finne sidetittelen ved å identifisere indeksene til de første åpne- og lukketaggene. Vi tar også hensyn til lengden på lukketaggen.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Som vist i eksempelet ovenfor, ble to variabler, start og finish, opprettet. Variabelen start inneholder indeksen til det første elementet innenfor den første forekomsten av <title>-elementet. Samtidig inneholder variabelen finish indeksen til tegnet umiddelbart etter den avsluttende </title>-taggen. .find()-metoden ga selv den første indeksen til lukketaggen, så vi la til lengden på taggen for å få indeksen til det siste elementet.

Note
Les mer

Listeslicing utelater det siste elementet, derfor finner vi neste tegn etter avslutningstagen.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain how the .find() method works in more detail?

What other string methods can I use to process the web page content?

How can I extract other elements from the HTML using similar techniques?

Awesome!

Completion rate improved to 4.35

bookAnvendelse av Strengmetoder

Sveip for å vise menyen

Hva kan du gjøre med den leste siden? Det er en streng, så du kan benytte alle strengmetoder. For eksempel kan du bruke .find()-metoden, som returnerer indeksen til den første forekomsten av et spesifikt element. For eksempel kan du finne sidetittelen ved å identifisere indeksene til de første åpne- og lukketaggene. Vi tar også hensyn til lengden på lukketaggen.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Som vist i eksempelet ovenfor, ble to variabler, start og finish, opprettet. Variabelen start inneholder indeksen til det første elementet innenfor den første forekomsten av <title>-elementet. Samtidig inneholder variabelen finish indeksen til tegnet umiddelbart etter den avsluttende </title>-taggen. .find()-metoden ga selv den første indeksen til lukketaggen, så vi la til lengden på taggen for å få indeksen til det siste elementet.

Note
Les mer

Listeslicing utelater det siste elementet, derfor finner vi neste tegn etter avslutningstagen.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10
some-alt