Herausforderung: Tokenisierung Mit Regex
Aufgabe
Swipe to start coding
Gegeben ist ein String namens message
, konvertiere ihn in Kleinbuchstaben und tokenisiere ihn dann in Wörter unter Verwendung der regulären Ausdruck-Tokenisierung und der entsprechenden nltk
-Klasse. Ein Wort ist eine Sequenz von nur alphanumerischen Zeichen (Buchstaben und Zahlen). '#Conference2023!'
enthält zum Beispiel ein Wort: Conference2023
.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 6