Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Stammformenbildung | Ermittlung der Häufigsten Wörter im Text
Ermittlung der Häufigsten Wörter im Text

book
Stammformenbildung

Der Porter-Stemming-Algorithmus ist eine hoch angesehene und weit verbreitete Methode in der natürlichen Sprachverarbeitung zum Stemming. Stemming, ein Prozess, der darin besteht, Wörter auf ihre Stamm- oder Basisform zu kürzen, wird durch systematisches Entfernen von Endungen erreicht.

Bekannt für seine Effizienz bei der Verarbeitung von englischem Text, bedient sich der Porter-Stemmer einer Reihe regelbasierter Ansätze, um gängige Endungen von Wörtern zu eliminieren. Diese Fähigkeit, Wörter auf ihre Stämme zu reduzieren, verringert die Dimensionalität der Textdaten erheblich.

Aufgabe

Swipe to start coding

  1. Importiere die PorterStemmer-Klasse zum Stemming aus NLTK.
  2. Erstelle eine Instanz des PorterStemmers.
  3. Wende das Stemming an auf jedes Wort in der zuvor gefilterten Liste.

Lösung

# Import the PorterStemmer class from NLTK for stemming
from nltk.stem import PorterStemmer

# Create an instance of the PorterStemmer
stemmer = PorterStemmer()

# Apply stemming to each word in the filtered list
stemmed_words = [stemmer.stem(word) for word in filtered_list]

# Display the stemmed words
stemmed_words

Mark tasks as Completed
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
AVAILABLE TO ULTIMATE ONLY
some-alt