Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Lemmatisaatio Sanaluokkien Tunnistuksella | Stemmaus ja Lemmatisaatio
Johdatus NLP:hen

bookHaaste: Lemmatisaatio Sanaluokkien Tunnistuksella

Tehtävä

Swipe to start coding

Sinulle annetaan teksti muuttujassa text. Tehtävänäsi on suorittaa lemmatisaatio käyttäen sanaluokkia (POS-tageja) tälle tekstille. Toimi seuraavasti:

  1. Muunna text pieniksi kirjaimiksi ja tallenna tulos muuttujaan text_lower.
  2. Tokenisoi merkkijono text_lower ja tallenna tulos muuttujaan tokens.
  3. Lataa englannin stop-sanat, muunna ne set-tyyppiseksi ja tallenna muuttujaan stop_words.
  4. Suodata stop-sanat pois listan käsittelyllä ja tallenna tulos muuttujaan filtered_tokens.
  5. Suorita sanaluokkien tunnistus (POS-tunnistus) vastaavalla funktiolla ja tallenna tulos muuttujaan tagged_tokens.
  6. Luo WordNet Lemmatizer ja tallenna se muuttujaan lemmatizer.
  7. Lemmatiseeraa tokenit huomioiden niiden sanaluokat listan käsittelyllä ja tallenna tulos muuttujaan lemmatized_tokens.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 8
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookHaaste: Lemmatisaatio Sanaluokkien Tunnistuksella

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle annetaan teksti muuttujassa text. Tehtävänäsi on suorittaa lemmatisaatio käyttäen sanaluokkia (POS-tageja) tälle tekstille. Toimi seuraavasti:

  1. Muunna text pieniksi kirjaimiksi ja tallenna tulos muuttujaan text_lower.
  2. Tokenisoi merkkijono text_lower ja tallenna tulos muuttujaan tokens.
  3. Lataa englannin stop-sanat, muunna ne set-tyyppiseksi ja tallenna muuttujaan stop_words.
  4. Suodata stop-sanat pois listan käsittelyllä ja tallenna tulos muuttujaan filtered_tokens.
  5. Suorita sanaluokkien tunnistus (POS-tunnistus) vastaavalla funktiolla ja tallenna tulos muuttujaan tagged_tokens.
  6. Luo WordNet Lemmatizer ja tallenna se muuttujaan lemmatizer.
  7. Lemmatiseeraa tokenit huomioiden niiden sanaluokat listan käsittelyllä ja tallenna tulos muuttujaan lemmatized_tokens.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 8
single

single

some-alt