Kursinhalt
Automatisierung der Datenerfassung aus Webquellen
Analysieren Sie den HTML-Inhalt mit BeautifulSoup
BeautifulSoup
ist eine Python-Bibliothek, die zum Parsen von HTML- und XML-Dokumenten verwendet wird. Sie erstellt Parse-Bäume, die hilfreich sind, um die Daten einfach zu extrahieren. Sie sitzt auf einem HTML- oder XML-Parser und bietet Python-typische Idiome zum Iterieren, Suchen und Modifizieren des Parse-Baums.
Hier ist ein Beispiel, wie man BeautifulSoup
verwendet, um ein HTML-Dokument zu parsen und einige Daten zu extrahieren:
Aufgabe
Swipe to start coding
- Importieren Sie die
BeautifulSoup
-Bibliothek. - Verwenden Sie die
BeautifulSoup
-Bibliothek, um den Inhalt der Website (html
) zu parsen. - Drucken Sie die Variable.
Lösung
Mark tasks as Completed
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 3
AVAILABLE TO ULTIMATE ONLY