Sektion 1. Kapitel 11
single
Udfordring: Stemming
Stryg for at vise menuen
Opgave
Swipe to start coding
Du får en tekst i variablen text. Din opgave er at tokenisere denne tekst, fjerne stopord og anvende stemming på tokens. For at gøre dette:
- Importér Porter Stemmer.
- Konverter
texttil små bogstaver og gem det itext_lower. - Tokenisér strengen
text_lowerog gem resultatet itokens. - Indlæs engelske stopord, konverter dem til et
set, og gem dem istop_words. - Filtrér stopordene fra ved hjælp af list comprehension og gem resultatet i
filtered_tokens. - Opret en Porter Stemmer og gem den i
stemmer. - Anvend stemming på tokens ved hjælp af list comprehension og gem resultatet i
stemmed_tokens.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 1. Kapitel 11
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat