Racine
L'algorithme de stemming Porter est une méthode très appréciée et couramment utilisée dans le traitement du langage naturel pour réaliser le stemming. Le stemming, un processus qui consiste à tronquer les mots jusqu'à leur forme racine ou de base, est obtenu en supprimant systématiquement les suffixes.
Reconnu pour son efficacité dans le traitement des textes en anglais, le Porter Stemmer utilise une série d'approches basées sur des règles pour éliminer les suffixes communs des mots. Cette capacité à réduire les mots à leur racine diminue significativement la dimensionalité des données textuelles.
Swipe to start coding
- Importer la classe PorterStemmer pour effectuer le stemming depuis NLTK.
- Créer une instance du PorterStemmer.
- Appliquer le stemming à chaque mot de la liste filtrée précédemment.
Solution
Merci pour vos commentaires !