Summary  
Demonstrates how to use a Python HTML parsing library to load raw or fetched HTML into a structured object model, navigate its elements, and format the output using methods like .prettify().  

General domain of usage  
Web scraping

`BeautifulSoup` ist eine __Python-Bibliothek__, die umfangreiche Funktionen zum Parsen von __HTML__-Seiten bietet. Im vorherigen Abschnitt wurde mit __HTML__ als Zeichenkette gearbeitet, was erhebliche Einschränkungen mit sich brachte.

Um `BeautifulSoup` zu installieren, führen Sie den folgenden Befehl im Terminal oder in der Eingabeaufforderung aus: 
- `pip install beautifulsoup4`;
- Zum Einstieg importieren Sie `BeautifulSoup` aus `bs4`:

`from bs4 import BeautifulSoup`.

# Importing the library
from bs4 import BeautifulSoup
print(BeautifulSoup)

Diese Bibliothek ist für die Arbeit mit **HTML**-Dateien konzipiert und verarbeitet keine Links. Sie können dies jedoch mit `urlopen` aus `urllib.request` steuern. Um mit dem Parsen zu beginnen, übergeben Sie der Funktion `BeautifulSoup` zwei Parameter: die **HTML**-Datei und den Parser (verwenden Sie den integrierten `html.parser`). Dadurch wird ein `BeautifulSoup`-Objekt erstellt. Zum Beispiel eine Webseite öffnen und lesen.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(type(soup))
print(soup)

Die erste Methode, die untersucht werden soll, ist `.prettify()`, welche die **HTML**-Datei als verschachtelte Datenstruktur anzeigt.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.prettify())

Erlernen Sie das automatische Extrahieren wertvoller Daten von Websites. Beherrschen Sie Techniken zur effizienten Informationsgewinnung, um fundierte Analysen durchzuführen, datenbasierte Entscheidungen zu treffen und neue Erkenntnisse aus der Fülle an Online-Informationen zu gewinnen.

Untersuchung der Struktur einer HTML-Datei, effizientes Laden sowie Erwerb praktischer Fähigkeiten im Umgang mit den enthaltenen Daten.

Grundlagen von Beautiful Soup zur Extraktion von Daten aus HTML-Dokumenten. Struktur von HTML analysieren, gezielte Elemente ansprechen und mit deren Kindelementen arbeiten, um eine solide Basis im Web Scraping zu schaffen.

Beherrschen Sie den Umgang mit Elementattributen und -inhalten unter Verwendung von Beautiful Soup. Erwerben Sie die Fähigkeiten, spezifische Informationen zu extrahieren, Elemente anhand von Attributwerten zu suchen und fortgeschrittene Techniken zur effizienten Analyse und Auswertung von HTML-Daten anzuwenden.

Was ist Beautiful Soup?