Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Anvendelse af Strengmetoder | Introduktion til HTML
Web Scraping med Python

bookAnvendelse af Strengmetoder

Hvad kan du gøre med den læste side? Det er en streng, så du kan anvende enhver strengmetode. For eksempel kan du bruge .find()-metoden, som returnerer indekset for den første forekomst af et specifikt element. For eksempel kan du finde sidetitlen ved at identificere indeksene for de første åbne og lukkede tags. Vi tager også højde for længden af det lukkende tag.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Som vist i eksemplet ovenfor blev to variabler, start og finish, oprettet. Variablen start indeholder indekset for det første element inden for den første forekomst af <title>-elementet. Samtidig indeholder variablen finish indekset for tegnet umiddelbart efter det lukkende </title>-tag. .find()-metoden gav selv det oprindelige indeks for det lukkende tag, så vi lagde længden af tagget til for at opnå indekset for det sidste element.

Note
Læs Mere

Listeudsnit udelader det sidste element, hvilket er grunden til, at vi finder det næste tegn efter slutmærket.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 10

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain how the .find() method works in more detail?

What other string methods can I use to process the web page content?

How can I extract other elements from the HTML using similar techniques?

Awesome!

Completion rate improved to 4.35

bookAnvendelse af Strengmetoder

Stryg for at vise menuen

Hvad kan du gøre med den læste side? Det er en streng, så du kan anvende enhver strengmetode. For eksempel kan du bruge .find()-metoden, som returnerer indekset for den første forekomst af et specifikt element. For eksempel kan du finde sidetitlen ved at identificere indeksene for de første åbne og lukkede tags. Vi tager også højde for længden af det lukkende tag.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Som vist i eksemplet ovenfor blev to variabler, start og finish, oprettet. Variablen start indeholder indekset for det første element inden for den første forekomst af <title>-elementet. Samtidig indeholder variablen finish indekset for tegnet umiddelbart efter det lukkende </title>-tag. .find()-metoden gav selv det oprindelige indeks for det lukkende tag, så vi lagde længden af tagget til for at opnå indekset for det sidste element.

Note
Læs Mere

Listeudsnit udelader det sidste element, hvilket er grunden til, at vi finder det næste tegn efter slutmærket.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 10
some-alt