Johdanto Web-Scrapingiin
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping eli verkkosivujen tietojen kerääminen toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä tiedon poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin aikana keskitytään pääasiassa kahteen ensimmäiseen kirjastoon. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
What are the main differences between these libraries?
When should I use Selenium instead of the other libraries?
Can you explain why JavaScript support is important for web scraping?
Awesome!
Completion rate improved to 4.35
Johdanto Web-Scrapingiin
Pyyhkäise näyttääksesi valikon
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping eli verkkosivujen tietojen kerääminen toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä tiedon poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin aikana keskitytään pääasiassa kahteen ensimmäiseen kirjastoon. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!