Verkkosivujen Tietojen Keruun Perusteet

Tervetuloa kurssille! Tänään aloitamme tutustumisen siihen, miten web scraping toimii.
Web Scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä datan poimintaan. Verrataan suosituimpia web-scraping -kirjastoja: requests
, BeautifulSoup
, lxml
ja Selenium
.
Tämän kurssin aikana keskitymme ensisijaisesti kahteen ensimmäiseen kirjastoon. On kuitenkin hyvä huomioida, että selenium
ja lxml
ovat erittäin tehokkaita työkaluja:
Selenium
mahdollistaa JavaScriptin tuen, mikä on ohjelmointikieli, jonka avulla kehittäjät voivat käsitellä dynaamisia kenttiä ja valikoita;lxml
helpottaa työskentelyä sekä HTML- että XML-tiedostojen kanssa.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4.35
Verkkosivujen Tietojen Keruun Perusteet
Pyyhkäise näyttääksesi valikon

Tervetuloa kurssille! Tänään aloitamme tutustumisen siihen, miten web scraping toimii.
Web Scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä datan poimintaan. Verrataan suosituimpia web-scraping -kirjastoja: requests
, BeautifulSoup
, lxml
ja Selenium
.
Tämän kurssin aikana keskitymme ensisijaisesti kahteen ensimmäiseen kirjastoon. On kuitenkin hyvä huomioida, että selenium
ja lxml
ovat erittäin tehokkaita työkaluja:
Selenium
mahdollistaa JavaScriptin tuen, mikä on ohjelmointikieli, jonka avulla kehittäjät voivat käsitellä dynaamisia kenttiä ja valikoita;lxml
helpottaa työskentelyä sekä HTML- että XML-tiedostojen kanssa.
Kiitos palautteestasi!