Section 1. Chapitre 6
single
Défi : Tokenisation avec Regex
Glissez pour afficher le menu
Tâche
Swipe to start coding
Un message est fourni dans la variable message. Vous devez le segmenter en mots à l'aide d'une expression régulière. Pour cela :
- Importer la classe nécessaire.
- Convertir
messageen minuscules et enregistrer le résultat dansmessage_lower. - Créer un Regexp Tokenizer avec le bon motif et l'enregistrer dans
word_tokenizer. - Segmenter
message_loweren mots à l'aide deword_tokenizer.
Un mot est une suite de caractères alphanumériques et de soulignements. Par exemple, '#NLPConference_20!' contient un seul mot : NLPConference_20.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 1. Chapitre 6
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion