Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Verkkosivujen Tietojen Keruun Perusteet | Getting Acquainted with HTML
Verkkosivujen Tietojen Keruu Pythonilla

bookVerkkosivujen Tietojen Keruun Perusteet

Prerequisites
Edellytykset

Tervetuloa kurssille! Tänään aloitamme tutustumisen siihen, miten web scraping toimii.

Note
Määritelmä

Web Scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.

Pythonissa on lukuisia menetelmiä datan poimintaan. Verrataan suosituimpia web-scraping -kirjastoja: requests, BeautifulSoup, lxml ja Selenium.

Tämän kurssin aikana keskitymme ensisijaisesti kahteen ensimmäiseen kirjastoon. On kuitenkin hyvä huomioida, että selenium ja lxml ovat erittäin tehokkaita työkaluja:

  • Selenium mahdollistaa JavaScriptin tuen, mikä on ohjelmointikieli, jonka avulla kehittäjät voivat käsitellä dynaamisia kenttiä ja valikoita;
  • lxml helpottaa työskentelyä sekä HTML- että XML-tiedostojen kanssa.
question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4.35

bookVerkkosivujen Tietojen Keruun Perusteet

Pyyhkäise näyttääksesi valikon

Prerequisites
Edellytykset

Tervetuloa kurssille! Tänään aloitamme tutustumisen siihen, miten web scraping toimii.

Note
Määritelmä

Web Scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.

Pythonissa on lukuisia menetelmiä datan poimintaan. Verrataan suosituimpia web-scraping -kirjastoja: requests, BeautifulSoup, lxml ja Selenium.

Tämän kurssin aikana keskitymme ensisijaisesti kahteen ensimmäiseen kirjastoon. On kuitenkin hyvä huomioida, että selenium ja lxml ovat erittäin tehokkaita työkaluja:

  • Selenium mahdollistaa JavaScriptin tuen, mikä on ohjelmointikieli, jonka avulla kehittäjät voivat käsitellä dynaamisia kenttiä ja valikoita;
  • lxml helpottaa työskentelyä sekä HTML- että XML-tiedostojen kanssa.
question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1
some-alt