Verkkosivujen Tietojen Keruun Perusteet
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä datan poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin pääpaino on kahdessa ensimmäisessä kirjastossa. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
What are the main differences between these libraries?
When should I use Selenium instead of the other libraries?
Can you explain why JavaScript support is important for web scraping?
Awesome!
Completion rate improved to 4.35
Verkkosivujen Tietojen Keruun Perusteet
Pyyhkäise näyttääksesi valikon
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä datan poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin pääpaino on kahdessa ensimmäisessä kirjastossa. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!