Anwenden von String-Methoden
Was lässt sich mit der eingelesenen Seite machen? Da es sich um einen String handelt, können beliebige String-Methoden verwendet werden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Damit lässt sich der Seitentitel auffinden, indem die Indizes der öffnenden und schließenden Tags ermittelt und die Länge des schließenden Tags berücksichtigt wird.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu bestimmen.
Beim Listenslicing wird das letzte Element ausgeschlossen, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4.35
Anwenden von String-Methoden
Swipe um das Menü anzuzeigen
Was lässt sich mit der eingelesenen Seite machen? Da es sich um einen String handelt, können beliebige String-Methoden verwendet werden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Damit lässt sich der Seitentitel auffinden, indem die Indizes der öffnenden und schließenden Tags ermittelt und die Länge des schließenden Tags berücksichtigt wird.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu bestimmen.
Beim Listenslicing wird das letzte Element ausgeschlossen, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.
Danke für Ihr Feedback!