Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Useiden Elementtien Attribuutit ja Sisällöt | Elementtien Attribuuttien Käsittely Beautiful Soupissa
Verkkosivujen Tietojen Keruu Pythonilla

bookUseiden Elementtien Attribuutit ja Sisällöt

Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa kaikkiin tietyn tunnisteen omaaviin elementteihin (eli .find_all()-menetelmän tulokseen). On kuitenkin tärkeää muistaa, että .find_all()-menetelmän tuloksena saadaan lista, joten jokaisen elementin ominaisuuksia ja menetelmiä tulee käyttää erikseen. Kuten aiemmin, tässäkin yhteydessä tulee käyttää for-silmukkaa. Esimerkiksi haetaan kaikkien <div>-elementtien kaikki attribuutit.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Samaa lähestymistapaa voidaan käyttää tekstin hakemiseen. Esimerkiksi haetaan kaikki tekstit kaikista <p>-elementeistä.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4.35

bookUseiden Elementtien Attribuutit ja Sisällöt

Pyyhkäise näyttääksesi valikon

Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa kaikkiin tietyn tunnisteen omaaviin elementteihin (eli .find_all()-menetelmän tulokseen). On kuitenkin tärkeää muistaa, että .find_all()-menetelmän tuloksena saadaan lista, joten jokaisen elementin ominaisuuksia ja menetelmiä tulee käyttää erikseen. Kuten aiemmin, tässäkin yhteydessä tulee käyttää for-silmukkaa. Esimerkiksi haetaan kaikkien <div>-elementtien kaikki attribuutit.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Samaa lähestymistapaa voidaan käyttää tekstin hakemiseen. Esimerkiksi haetaan kaikki tekstit kaikista <p>-elementeistä.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3
some-alt