Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Атрибути та вміст кількох елементів | Робота з Атрибутами Елементів у Beautiful Soup
Web Scraping з Python

bookАтрибути та вміст кількох елементів

Усі методи, розглянуті в попередньому розділі, можна застосовувати до всіх елементів із певним тегом (тобто до результату методу .find_all()). Однак важливо пам'ятати, що результат застосування методу .find_all() — це список, тому необхідно використовувати атрибути та методи для кожного елемента окремо. Як і раніше, у цьому випадку слід використовувати цикл for. Наприклад, давайте отримаємо всі атрибути всіх елементів <div>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Такий самий підхід застосовується для отримання тексту. Наприклад, давайте отримаємо весь текст із усіх елементів <p>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 3

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 4.35

bookАтрибути та вміст кількох елементів

Свайпніть щоб показати меню

Усі методи, розглянуті в попередньому розділі, можна застосовувати до всіх елементів із певним тегом (тобто до результату методу .find_all()). Однак важливо пам'ятати, що результат застосування методу .find_all() — це список, тому необхідно використовувати атрибути та методи для кожного елемента окремо. Як і раніше, у цьому випадку слід використовувати цикл for. Наприклад, давайте отримаємо всі атрибути всіх елементів <div>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Такий самий підхід застосовується для отримання тексту. Наприклад, давайте отримаємо весь текст із усіх елементів <p>.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 3
some-alt