Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Stammformenbildung | Ermittlung der Häufigsten Wörter im Text
Ermittlung der Häufigsten Wörter im Text
course content

Kursinhalt

Ermittlung der Häufigsten Wörter im Text

book
Stammformenbildung

Der Porter-Stemming-Algorithmus ist eine hoch angesehene und weit verbreitete Methode in der natürlichen Sprachverarbeitung zum Stemming. Stemming, ein Prozess, der darin besteht, Wörter auf ihre Stamm- oder Basisform zu kürzen, wird durch systematisches Entfernen von Endungen erreicht.

Bekannt für seine Effizienz bei der Verarbeitung von englischem Text, bedient sich der Porter-Stemmer einer Reihe regelbasierter Ansätze, um gängige Endungen von Wörtern zu eliminieren. Diese Fähigkeit, Wörter auf ihre Stämme zu reduzieren, verringert die Dimensionalität der Textdaten erheblich.

Aufgabe

Swipe to start coding

  1. Importiere die PorterStemmer-Klasse zum Stemming aus NLTK.
  2. Erstelle eine Instanz des PorterStemmers.
  3. Wende das Stemming an auf jedes Wort in der zuvor gefilterten Liste.

Lösung

Mark tasks as Completed
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
AVAILABLE TO ULTIMATE ONLY
We're sorry to hear that something went wrong. What happened?
some-alt