Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Useiden Elementtien Attribuutit ja Sisällöt | Elementtien Attribuuttien Käsittely Beautiful Soupilla
Web Scraping Pythonilla

bookUseiden Elementtien Attribuutit ja Sisällöt

Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa tietyn tunnisteen omaaviin elementteihin, eli .find_all()-metodin tulokseen. Koska .find_all() palauttaa listan, täytyy ominaisuuksiin ja metodeihin päästä käsiksi jokaisen elementin kohdalla erikseen. Käytä tähän tarkoitukseen for-silmukkaa. Esimerkiksi, hae kaikkien <div>-elementtien kaikki attribuutit.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4.35

bookUseiden Elementtien Attribuutit ja Sisällöt

Pyyhkäise näyttääksesi valikon

Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa tietyn tunnisteen omaaviin elementteihin, eli .find_all()-metodin tulokseen. Koska .find_all() palauttaa listan, täytyy ominaisuuksiin ja metodeihin päästä käsiksi jokaisen elementin kohdalla erikseen. Käytä tähän tarkoitukseen for-silmukkaa. Esimerkiksi, hae kaikkien <div>-elementtien kaikki attribuutit.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3
some-alt