Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Johdanto Web-Scrapingiin | HTML:n Perusteet
Web Scraping Pythonilla

bookJohdanto Web-Scrapingiin

Prerequisites
Edellytykset

Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping eli verkkosivujen tietojen kerääminen toimii.

Note
Määritelmä

Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.

Pythonissa on lukuisia menetelmiä tiedon poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.

Tämän kurssin aikana keskitytään pääasiassa kahteen ensimmäiseen kirjastoon. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:

  • selenium mahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;
  • lxml helpottaa sekä HTML- että XML-tiedostojen käsittelyä.
question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookJohdanto Web-Scrapingiin

Pyyhkäise näyttääksesi valikon

Prerequisites
Edellytykset

Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping eli verkkosivujen tietojen kerääminen toimii.

Note
Määritelmä

Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.

Pythonissa on lukuisia menetelmiä tiedon poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.

Tämän kurssin aikana keskitytään pääasiassa kahteen ensimmäiseen kirjastoon. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:

  • selenium mahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;
  • lxml helpottaa sekä HTML- että XML-tiedostojen käsittelyä.
question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1
some-alt