Contenu du cours
Identifier les Mots les Plus Fréquents dans un Texte
Identifier les Mots les Plus Fréquents dans un Texte
Racine
L'algorithme de stemming Porter est une méthode très appréciée et couramment utilisée dans le traitement du langage naturel pour réaliser le stemming. Le stemming, un processus qui consiste à tronquer les mots jusqu'à leur forme racine ou de base, est obtenu en supprimant systématiquement les suffixes.
Reconnu pour son efficacité dans le traitement des textes en anglais, le Porter Stemmer utilise une série d'approches basées sur des règles pour éliminer les suffixes communs des mots. Cette capacité à réduire les mots à leur racine diminue significativement la dimensionalité des données textuelles.
Tâche
Swipe to start coding
- Importer la classe PorterStemmer pour effectuer le stemming depuis NLTK.
- Créer une instance du PorterStemmer.
- Appliquer le stemming à chaque mot de la liste filtrée précédemment.
Solution
Mark tasks as Completed
Tout était clair ?
Merci pour vos commentaires !
Section 1. Chapitre 6
AVAILABLE TO ULTIMATE ONLY