Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Tokenisering med Regex | Grundlæggende Tekstforbehandling
Introduktion til NLP

bookUdfordring: Tokenisering med Regex

Opgave

Swipe to start coding

Du får en besked i variablen message. Du skal opdele den i ord ved hjælp af regex. For at gøre dette:

  1. Importér den nødvendige klasse.
  2. Konverter message til små bogstaver og gem det i message_lower.
  3. Opret en Regexp Tokenizer med det korrekte mønster og gem den i word_tokenizer.
  4. Opdel message_lower i ord ved hjælp af word_tokenizer.

Et ord er en sekvens af alfanumeriske tegn og underscores. For eksempel indeholder '#NLPConference_20!' ét ord: NLPConference_20.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 6
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain this in more detail?

What are the main benefits or drawbacks?

Can you give an example?

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: Tokenisering med Regex

Stryg for at vise menuen

Opgave

Swipe to start coding

Du får en besked i variablen message. Du skal opdele den i ord ved hjælp af regex. For at gøre dette:

  1. Importér den nødvendige klasse.
  2. Konverter message til små bogstaver og gem det i message_lower.
  3. Opret en Regexp Tokenizer med det korrekte mønster og gem den i word_tokenizer.
  4. Opdel message_lower i ord ved hjælp af word_tokenizer.

Et ord er en sekvens af alfanumeriske tegn og underscores. For eksempel indeholder '#NLPConference_20!' ét ord: NLPConference_20.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 6
single

single

some-alt