Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Stopord | Grundlæggende Tekstforbehandling
Introduktion til NLP

bookUdfordring: Stopord

Opgave

Swipe to start coding

Du får en tekst i variablen text. Din opgave er at tokenisere teksten og fjerne stopord. For at gøre dette:

  1. Importér nødvendige komponenter.
  2. Konverter teksten til små bogstaver og gem den i text_lower.
  3. Indlæs listen over engelske stopord fra nltk, konverter den til et set, og gem den i stop_words.
  4. Tokenisér strengen text_lower ved hjælp af funktionen word_tokenize() og gem resultatet i tokens.
  5. Filtrér stopordene fra tokens ved hjælp af list comprehension og gem resultatet i tokens_clean.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain this in more detail?

What are the next steps I should take?

Can you give me an example?

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: Stopord

Stryg for at vise menuen

Opgave

Swipe to start coding

Du får en tekst i variablen text. Din opgave er at tokenisere teksten og fjerne stopord. For at gøre dette:

  1. Importér nødvendige komponenter.
  2. Konverter teksten til små bogstaver og gem den i text_lower.
  3. Indlæs listen over engelske stopord fra nltk, konverter den til et set, og gem den i stop_words.
  4. Tokenisér strengen text_lower ved hjælp af funktionen word_tokenize() og gem resultatet i tokens.
  5. Filtrér stopordene fra tokens ved hjælp af list comprehension og gem resultatet i tokens_clean.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 8
single

single

some-alt