Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Anwenden von String-Methoden | Einführung in HTML
Quizzes & Challenges
Quizzes
Challenges
/
Web Scraping Mit Python

bookAnwenden von String-Methoden

Was lässt sich mit der eingelesenen Seite machen? Da es sich um einen String handelt, können beliebige String-Methoden verwendet werden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Damit lässt sich der Seitentitel auffinden, indem die Indizes der öffnenden und schließenden Tags ermittelt und die Länge des schließenden Tags berücksichtigt wird.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu bestimmen.

Note
Mehr erfahren

Beim Listenslicing wird das letzte Element ausgeschlossen, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 10

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 4.35

bookAnwenden von String-Methoden

Swipe um das Menü anzuzeigen

Was lässt sich mit der eingelesenen Seite machen? Da es sich um einen String handelt, können beliebige String-Methoden verwendet werden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Damit lässt sich der Seitentitel auffinden, indem die Indizes der öffnenden und schließenden Tags ermittelt und die Länge des schließenden Tags berücksichtigt wird.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu bestimmen.

Note
Mehr erfahren

Beim Listenslicing wird das letzte Element ausgeschlossen, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 10
some-alt