Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Anwenden von String-Methoden | Einführung in HTML
Web Scraping Mit Python

bookAnwenden von String-Methoden

Was kann mit der geladenen Seite gemacht werden? Es handelt sich um einen String, daher können beliebige String-Methoden verwendet werden. Beispielsweise kann die Methode .find() genutzt werden, die den Index des ersten Vorkommens eines bestimmten Elements zurückgibt. So lässt sich beispielsweise der Seitentitel finden, indem die Indizes des ersten öffnenden und schließenden Tags ermittelt werden. Dabei wird auch die Länge des schließenden Tags berücksichtigt.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start enthält den Index des ersten Elements innerhalb des ersten Vorkommens des <title>-Elements. Die Variable finish enthält den Index des Zeichens unmittelbar nach dem schließenden </title>-Tag. Die Methode .find() liefert selbst den Anfangsindex des schließenden Tags, daher wurde die Länge des Tags addiert, um den Index des letzten Elements zu erhalten.

Note
Mehr erfahren

Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag gesucht wird.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 10

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain how the .find() method works in more detail?

What other string methods can I use to process the web page content?

How can I extract other elements from the HTML using similar techniques?

Awesome!

Completion rate improved to 4.35

bookAnwenden von String-Methoden

Swipe um das Menü anzuzeigen

Was kann mit der geladenen Seite gemacht werden? Es handelt sich um einen String, daher können beliebige String-Methoden verwendet werden. Beispielsweise kann die Methode .find() genutzt werden, die den Index des ersten Vorkommens eines bestimmten Elements zurückgibt. So lässt sich beispielsweise der Seitentitel finden, indem die Indizes des ersten öffnenden und schließenden Tags ermittelt werden. Dabei wird auch die Länge des schließenden Tags berücksichtigt.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start enthält den Index des ersten Elements innerhalb des ersten Vorkommens des <title>-Elements. Die Variable finish enthält den Index des Zeichens unmittelbar nach dem schließenden </title>-Tag. Die Methode .find() liefert selbst den Anfangsindex des schließenden Tags, daher wurde die Länge des Tags addiert, um den Index des letzten Elements zu erhalten.

Note
Mehr erfahren

Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag gesucht wird.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 10
some-alt