Herausforderung: Stoppwörter
Aufgabe
Swipe to start coding
Sie erhalten einen Text in der Variablen text. Ihre Aufgabe besteht darin, diesen zu tokenisieren und die Stoppwörter zu entfernen. Gehen Sie dazu wie folgt vor:
- Importieren Sie die erforderlichen Komponenten.
- Konvertieren Sie den Text in Kleinbuchstaben und speichern Sie ihn in
text_lower. - Laden Sie die Liste der englischen Stoppwörter aus
nltk, wandeln Sie diese in einsetum und speichern Sie sie instop_words. - Tokenisieren Sie den String
text_lowermit der Funktionword_tokenize()und speichern Sie das Ergebnis intokens. - Filtern Sie die Stoppwörter aus
tokensmithilfe von List Comprehension heraus und speichern Sie das Ergebnis intokens_clean.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 8
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.45
Herausforderung: Stoppwörter
Swipe um das Menü anzuzeigen
Aufgabe
Swipe to start coding
Sie erhalten einen Text in der Variablen text. Ihre Aufgabe besteht darin, diesen zu tokenisieren und die Stoppwörter zu entfernen. Gehen Sie dazu wie folgt vor:
- Importieren Sie die erforderlichen Komponenten.
- Konvertieren Sie den Text in Kleinbuchstaben und speichern Sie ihn in
text_lower. - Laden Sie die Liste der englischen Stoppwörter aus
nltk, wandeln Sie diese in einsetum und speichern Sie sie instop_words. - Tokenisieren Sie den String
text_lowermit der Funktionword_tokenize()und speichern Sie das Ergebnis intokens. - Filtern Sie die Stoppwörter aus
tokensmithilfe von List Comprehension heraus und speichern Sie das Ergebnis intokens_clean.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 8
single