Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Stemmaus | Stemmaus ja Lemmatisaatio
Johdatus NLP:hen

bookHaaste: Stemmaus

Tehtävä

Swipe to start coding

Sinulle annetaan teksti muuttujassa text. Tehtävänäsi on pilkkoa tämä teksti sanoiksi (tokenisointi), poistaa stop-sanat ja suorittaa sanojen stemmaus. Toimi seuraavasti:

  1. Tuo Porter Stemmer -luokka.
  2. Muunna text pieniksi kirjaimiksi ja tallenna se muuttujaan text_lower.
  3. Tokenisoi text_lower-merkkijono ja tallenna tulos muuttujaan tokens.
  4. Lataa englanninkieliset stop-sanat, muunna ne set-tyyppiseksi ja tallenna muuttujaan stop_words.
  5. Suodata stop-sanat pois listan käsittelyllä ja tallenna tulos muuttujaan filtered_tokens.
  6. Luo Porter Stemmer -olio ja tallenna se muuttujaan stemmer.
  7. Suorita stemmaus sanoille listan käsittelyllä ja tallenna tulos muuttujaan stemmed_tokens.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.45

bookHaaste: Stemmaus

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle annetaan teksti muuttujassa text. Tehtävänäsi on pilkkoa tämä teksti sanoiksi (tokenisointi), poistaa stop-sanat ja suorittaa sanojen stemmaus. Toimi seuraavasti:

  1. Tuo Porter Stemmer -luokka.
  2. Muunna text pieniksi kirjaimiksi ja tallenna se muuttujaan text_lower.
  3. Tokenisoi text_lower-merkkijono ja tallenna tulos muuttujaan tokens.
  4. Lataa englanninkieliset stop-sanat, muunna ne set-tyyppiseksi ja tallenna muuttujaan stop_words.
  5. Suodata stop-sanat pois listan käsittelyllä ja tallenna tulos muuttujaan filtered_tokens.
  6. Luo Porter Stemmer -olio ja tallenna se muuttujaan stemmer.
  7. Suorita stemmaus sanoille listan käsittelyllä ja tallenna tulos muuttujaan stemmed_tokens.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2
single

single

some-alt