Pyyhkäise näyttääksesi valikon

Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa tietyn tunnisteen omaaviin elementteihin, eli .find_all()-metodin tulokseen. Koska .find_all() palauttaa listan, täytyy ominaisuuksiin ja metodeihin päästä käsiksi jokaisen elementin kohdalla erikseen. Käytä tähän tarkoitukseen for-silmukkaa. Esimerkiksi, hae kaikkien <div>-elementtien kaikki attribuutit.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for div in soup.find_all("div"):
  print(div.attrs)

Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for p in soup.find_all("p"):
  print(p.get_text())

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 3. Luku 3

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Useiden Elementtien Attribuutit ja Sisällöt


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for div in soup.find_all("div"):
  print(div.attrs)

Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.


              12345678910111213
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for p in soup.find_all("p"):
  print(p.get_text())

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 3. Luku 3