Summary  
Demonstrates how to use a Python HTML parsing library to load raw or fetched HTML into a structured object model, navigate its elements, and format the output using methods like .prettify().  

General domain of usage  
Web scraping

`BeautifulSoup` är ett __python-bibliotek__ som erbjuder omfattande funktionalitet för att parsa __HTML__-sidor. I föregående avsnitt arbetade du med __HTML__ som en sträng, vilket medförde betydande begränsningar.

För att installera `BeautifulSoup`, kör följande kommando i din terminal eller kommandoprompt: 
- `pip install beautifulsoup4`;
- För att komma igång, importera `BeautifulSoup` från `bs4`:

`from bs4 import BeautifulSoup`.

# Importing the library
from bs4 import BeautifulSoup
print(BeautifulSoup)

Detta bibliotek är utformat för att arbeta med **HTML**-filer och hanterar inte länkar. Du kan dock hantera detta med hjälp av `urlopen` från `urllib.request`. För att börja parsa, ange två parametrar till funktionen `BeautifulSoup`: **HTML**-filen och parsern (använd den inbyggda `html.parser`). Detta skapar ett `BeautifulSoup`-objekt. Till exempel, öppna och läs en webbsida.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(type(soup))
print(soup)

Den första metoden att utforska är `.prettify()`, som visar **HTML**-filen som en nästlad datastruktur.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.prettify())

Lär dig att automatiskt extrahera värdefull data från webbplatser. Behärska tekniker för att samla in information effektivt, vilket möjliggör djupgående analys, datadrivna beslut och nya insikter från det stora utbudet av onlineinformation.

Utforska strukturen hos en HTML-fil, lär dig hur du laddar den effektivt och få praktiska färdigheter i att arbeta med dess data.

Utforska grunderna i Beautiful Soup för att extrahera data från HTML-dokument. Lär dig att navigera i HTML-strukturen, komma åt specifika element och arbeta med deras underordnade element för att bygga en stark grund inom web scraping.

Behärska arbetet med elementattribut och innehåll med Beautiful Soup. Få färdigheter för att extrahera specifik information, söka efter element med attributvärden och använda avancerade tekniker för att effektivt tolka och analysera HTML-data.

Vad är Beautiful Soup?