Kursinhalt
Ermittlung der Häufigsten Wörter im Text
Ermittlung der Häufigsten Wörter im Text
Stammformenbildung
Der Porter-Stemming-Algorithmus ist eine hoch angesehene und weit verbreitete Methode in der natürlichen Sprachverarbeitung zum Stemming. Stemming, ein Prozess, der darin besteht, Wörter auf ihre Stamm- oder Basisform zu kürzen, wird durch systematisches Entfernen von Endungen erreicht.
Bekannt für seine Effizienz bei der Verarbeitung von englischem Text, bedient sich der Porter-Stemmer einer Reihe regelbasierter Ansätze, um gängige Endungen von Wörtern zu eliminieren. Diese Fähigkeit, Wörter auf ihre Stämme zu reduzieren, verringert die Dimensionalität der Textdaten erheblich.
Aufgabe
Swipe to start coding
- Importiere die PorterStemmer-Klasse zum Stemming aus NLTK.
- Erstelle eine Instanz des PorterStemmers.
- Wende das Stemming an auf jedes Wort in der zuvor gefilterten Liste.
Lösung
Mark tasks as Completed
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 6
AVAILABLE TO ULTIMATE ONLY