Aprenda O Que É Beautiful Soup? | Decodificando HTML com Beautiful Soup

Deslize para mostrar o menu

BeautifulSoup é uma biblioteca Python que oferece ampla funcionalidade para análise de páginas HTML. Na seção anterior, você trabalhou com HTML como uma string, o que impunha limitações significativas.

Para instalar o BeautifulSoup, execute o seguinte comando no seu terminal ou prompt de comando:

pip install beautifulsoup4;
Para começar, importe BeautifulSoup de bs4:

from bs4 import BeautifulSoup.


              123
            
# Importing the library
from bs4 import BeautifulSoup
print(BeautifulSoup)

Esta biblioteca é projetada para trabalhar com arquivos HTML e não lida com links. No entanto, é possível gerenciar isso utilizando urlopen do urllib.request. Para iniciar a análise, forneça dois parâmetros para a função BeautifulSoup: o arquivo HTML e o analisador (utilize o html.parser incorporado). Isso cria um objeto BeautifulSoup. Por exemplo, abra e leia uma página da web.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(type(soup))
print(soup)

O primeiro método a ser explorado é o .prettify(), que exibe o arquivo HTML como uma estrutura de dados aninhada.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.prettify())

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 2. Capítulo 1

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 2. Capítulo 1