Kursinhalt
Web Scraping mit Python
Web Scraping mit Python
3. Arbeiten mit Elementattributen in Beautiful Soup
Was Ist HTML?
Bevor wir weitermachen, ist es wichtig, das Konzept von HTML und seine Funktionalität zu verstehen.
Zum Beispiel, werfen Sie einen Blick auf die unten angezeigte Webseite, die über den folgenden Link erreichbar ist.
Die HTML-Struktur der Seite sieht folgendermaßen aus:
index.html
Lassen Sie uns einige Erklärungen durchgehen. Jedes HTML-Tag ist in spitze Klammern eingeschlossen, wobei eine linke Klammer <
und eine rechte Klammer >
verwendet wird. Die meisten HTML-Tags sind paarweise aufgebaut, bestehend aus einem öffnenden und einem schließenden Tag. Schließende Tags werden durch einen Schrägstrich /
eingeleitet.
Im oben dargestellten Schema haben wir die folgenden Tags verwendet:
<html>
- definiert ein HTML-Dokument (verpflichtender Tag für jedes Dokument);<title>
- definiert einen Seitentitel (wird in der Tab-Leiste angezeigt);<body>
- definiert den Body des Dokuments;<h2>
- definiert die zweite Ebene der Überschrift (es stehen 6 Ebenen zur Verfügung:<h1>
-<h6>
);<p>
- definiert einen Absatz.
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 2