Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Tokenização com Regex | Fundamentos de Pré-Processamento de Texto
Introdução ao PLN

bookDesafio: Tokenização com Regex

Tarefa

Swipe to start coding

Você recebe uma mensagem na variável message. Sua tarefa é tokenizá-la em palavras usando regex. Para isso:

  1. Importe a classe necessária.
  2. Converta message para letras minúsculas e salve em message_lower.
  3. Crie um Regexp Tokenizer com o padrão correto e salve em word_tokenizer.
  4. Tokenize message_lower em palavras usando word_tokenizer.

Uma palavra é uma sequência de caracteres alfanuméricos e underscores. '#NLPConference_20!', por exemplo, contém uma palavra: NLPConference_20.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 6
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain this in more detail?

What are the main benefits or drawbacks?

Can you give an example?

close

Awesome!

Completion rate improved to 3.45

bookDesafio: Tokenização com Regex

Deslize para mostrar o menu

Tarefa

Swipe to start coding

Você recebe uma mensagem na variável message. Sua tarefa é tokenizá-la em palavras usando regex. Para isso:

  1. Importe a classe necessária.
  2. Converta message para letras minúsculas e salve em message_lower.
  3. Crie um Regexp Tokenizer com o padrão correto e salve em word_tokenizer.
  4. Tokenize message_lower em palavras usando word_tokenizer.

Uma palavra é uma sequência de caracteres alfanuméricos e underscores. '#NLPConference_20!', por exemplo, contém uma palavra: NLPConference_20.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 6
single

single

some-alt