Summary  
Demonstrates how to use a Python HTML parsing library to load raw or fetched HTML into a structured object model, navigate its elements, and format the output using methods like .prettify().  

General domain of usage  
Web scraping

`BeautifulSoup` on __Python-kirjasto__, joka tarjoaa laajat ominaisuudet __HTML__-sivujen jäsentämiseen. Edellisessä osiossa käsittelit __HTML__:ää merkkijonona, mikä aiheutti merkittäviä rajoituksia.

Asentaaksesi `BeautifulSoup`-kirjaston, suorita seuraava komento terminaalissa tai komentokehotteessa: 
- `pip install beautifulsoup4`;
- Aloittaaksesi, tuo `BeautifulSoup` `bs4`-kirjastosta:

`from bs4 import BeautifulSoup`.

# Importing the library
from bs4 import BeautifulSoup
print(BeautifulSoup)

Tämä kirjasto on suunniteltu **HTML**-tiedostojen käsittelyyn, eikä se käsittele linkkejä. Voit kuitenkin hallita tätä käyttämällä `urlopen`-funktiota kirjastosta `urllib.request`. Jotta voit aloittaa jäsentämisen, anna kaksi parametria `BeautifulSoup`-funktiolle: **HTML**-tiedosto ja jäsentäjä (käytä sisäänrakennettua `html.parser`-jäsentäjää). Tämä luo `BeautifulSoup`-olion. Esimerkiksi avaa ja lue verkkosivu.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(type(soup))
print(soup)

Ensimmäinen tutkittava metodi on `.prettify()`, joka näyttää **HTML**-tiedoston sisennettynä tietorakenteena.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.prettify())

Opi keräämään arvokasta dataa verkkosivuilta automaattisesti. Hallitse tehokkaat tiedonkeruumenetelmät, jotka mahdollistavat syvällisen analyysin, tietoon perustuvan päätöksenteon ja uusien oivallusten löytämisen laajasta verkkotiedon määrästä.

Tutustu HTML-tiedoston rakenteeseen, opi lataamaan se tehokkaasti ja hanki käytännön taitoja sen sisältämän datan käsittelyyn.

Tutustu Beautiful Soupin perusteisiin tiedon poimimiseksi HTML-dokumenteista. Opiskele HTML:n rakenteen navigointia, tiettyihin elementteihin pääsyä sekä lapsielementtien käsittelyä vahvan pohjan rakentamiseksi web-scrapingiin.

Hallitse elementtien attribuuttien ja sisällön käsittely Beautiful Soupin avulla. Kehitä taidot tietyn tiedon poimimiseen, elementtien etsimiseen attribuuttien arvojen perusteella sekä edistyneiden tekniikoiden hyödyntämiseen HTML-datan tehokkaassa jäsentämisessä ja analysoinnissa.

Mikä on Beautiful Soup?