Anwenden von String-Methoden
Was kann mit der geladenen Seite gemacht werden? Es handelt sich um einen String, daher können beliebige String-Methoden verwendet werden. Beispielsweise kann die Methode .find()
genutzt werden, die den Index des ersten Vorkommens eines bestimmten Elements zurückgibt. So lässt sich beispielsweise der Seitentitel finden, indem die Indizes des ersten öffnenden und schließenden Tags ermittelt werden. Dabei wird auch die Länge des schließenden Tags berücksichtigt.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start
und finish
, erstellt. Die Variable start
enthält den Index des ersten Elements innerhalb des ersten Vorkommens des <title>
-Elements. Die Variable finish
enthält den Index des Zeichens unmittelbar nach dem schließenden </title>
-Tag. Die Methode .find()
liefert selbst den Anfangsindex des schließenden Tags, daher wurde die Länge des Tags addiert, um den Index des letzten Elements zu erhalten.
Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag gesucht wird.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain how the .find() method works in more detail?
What other string methods can I use to process the web page content?
How can I extract other elements from the HTML using similar techniques?
Awesome!
Completion rate improved to 4.35
Anwenden von String-Methoden
Swipe um das Menü anzuzeigen
Was kann mit der geladenen Seite gemacht werden? Es handelt sich um einen String, daher können beliebige String-Methoden verwendet werden. Beispielsweise kann die Methode .find()
genutzt werden, die den Index des ersten Vorkommens eines bestimmten Elements zurückgibt. So lässt sich beispielsweise der Seitentitel finden, indem die Indizes des ersten öffnenden und schließenden Tags ermittelt werden. Dabei wird auch die Länge des schließenden Tags berücksichtigt.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start
und finish
, erstellt. Die Variable start
enthält den Index des ersten Elements innerhalb des ersten Vorkommens des <title>
-Elements. Die Variable finish
enthält den Index des Zeichens unmittelbar nach dem schließenden </title>
-Tag. Die Methode .find()
liefert selbst den Anfangsindex des schließenden Tags, daher wurde die Länge des Tags addiert, um den Index des letzten Elements zu erhalten.
Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag gesucht wird.
Danke für Ihr Feedback!