Sectie 1. Hoofdstuk 6
single
Uitdaging: Tokenisatie met Regex
Veeg om het menu te tonen
Taak
Swipe to start coding
Je krijgt een bericht in de variabele message. Je moet dit bericht in woorden splitsen met behulp van regex. Volg hiervoor deze stappen:
- Importeer de benodigde klasse.
- Zet
messageom naar kleine letters en sla dit op inmessage_lower. - Maak een Regexp Tokenizer aan met het juiste patroon en sla deze op in
word_tokenizer. - Tokeniseer
message_lowerin woorden met behulp vanword_tokenizer.
Een woord is een reeks alfanumerieke tekens en underscores. '#NLPConference_20!' bevat bijvoorbeeld één woord: NLPConference_20.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 1. Hoofdstuk 6
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.