Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Stop-Sanat | Tekstin Esikäsittelyn Perusteet
Johdatus NLP:hen

bookHaaste: Stop-Sanat

Tehtävä

Swipe to start coding

Sinulle on annettu teksti muuttujassa text. Tehtävänäsi on pilkkoa se sanoiksi ja poistaa siitä stop-sanat. Toimi seuraavasti:

  1. Tuo tarvittavat komponentit.
  2. Muunna teksti pieniksi kirjaimiksi ja tallenna se muuttujaan text_lower.
  3. Lataa englanninkielisten stop-sanojen lista nltk-kirjastosta, muunna se set-tyyppiseksi ja tallenna muuttujaan stop_words.
  4. Pilko text_lower-merkkijono sanoiksi käyttämällä word_tokenize()-funktiota ja tallenna tulos muuttujaan tokens.
  5. Suodata stop-sanat pois tokens-listasta käyttäen list comprehension -rakennetta ja tallenna tulos muuttujaan tokens_clean.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 8
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.45

bookHaaste: Stop-Sanat

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle on annettu teksti muuttujassa text. Tehtävänäsi on pilkkoa se sanoiksi ja poistaa siitä stop-sanat. Toimi seuraavasti:

  1. Tuo tarvittavat komponentit.
  2. Muunna teksti pieniksi kirjaimiksi ja tallenna se muuttujaan text_lower.
  3. Lataa englanninkielisten stop-sanojen lista nltk-kirjastosta, muunna se set-tyyppiseksi ja tallenna muuttujaan stop_words.
  4. Pilko text_lower-merkkijono sanoiksi käyttämällä word_tokenize()-funktiota ja tallenna tulos muuttujaan tokens.
  5. Suodata stop-sanat pois tokens-listasta käyttäen list comprehension -rakennetta ja tallenna tulos muuttujaan tokens_clean.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 8
single

single

some-alt