Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Tokenisointi Säännöllisillä Lausekkeilla | Tekstin Esikäsittelyn Perusteet
Quizzes & Challenges
Quizzes
Challenges
/
Johdatus NLP:hen Pythonilla

bookHaaste: Tokenisointi Säännöllisillä Lausekkeilla

Tehtävä

Swipe to start coding

Sinulle on annettu viesti muuttujassa message. Sinun tulee pilkkoa se sanoiksi käyttäen säännöllisiä lausekkeita (regex). Toimi näin:

  1. Tuo tarvittava luokka.
  2. Muunna message pieniksi kirjaimiksi ja tallenna se muuttujaan message_lower.
  3. Luo Regexp Tokenizer oikealla kuviolla ja tallenna se muuttujaan word_tokenizer.
  4. Pilko message_lower sanoiksi käyttäen word_tokenizer-muuttujaa.

Sana on aakkosnumeeristen merkkien ja alaviivojen jono. Esimerkiksi '#NLPConference_20!' sisältää yhden sanan: NLPConference_20.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

bookHaaste: Tokenisointi Säännöllisillä Lausekkeilla

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle on annettu viesti muuttujassa message. Sinun tulee pilkkoa se sanoiksi käyttäen säännöllisiä lausekkeita (regex). Toimi näin:

  1. Tuo tarvittava luokka.
  2. Muunna message pieniksi kirjaimiksi ja tallenna se muuttujaan message_lower.
  3. Luo Regexp Tokenizer oikealla kuviolla ja tallenna se muuttujaan word_tokenizer.
  4. Pilko message_lower sanoiksi käyttäen word_tokenizer-muuttujaa.

Sana on aakkosnumeeristen merkkien ja alaviivojen jono. Esimerkiksi '#NLPConference_20!' sisältää yhden sanan: NLPConference_20.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6
single

single

some-alt