Johdanto Web-Scrapingiin
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping eli verkkosivujen tietojen kerääminen toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä tiedon poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin aikana keskitytään pääasiassa kahteen ensimmäiseen kirjastoon. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 4.35
Johdanto Web-Scrapingiin
Pyyhkäise näyttääksesi valikon
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping eli verkkosivujen tietojen kerääminen toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä tiedon poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin aikana keskitytään pääasiassa kahteen ensimmäiseen kirjastoon. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!