Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Racinisation | Racine et Lemmatisation
Introduction au TALN avec Python

bookDéfi : Racinisation

Tâche

Swipe to start coding

Vous disposez d'un texte dans la variable text. Votre tâche consiste à tokeniser ce texte, à supprimer les mots vides, puis à appliquer la racinisation (stemming) sur les jetons. Pour cela :

  1. Importez le Porter Stemmer.
  2. Convertissez text en minuscules et enregistrez-le dans text_lower.
  3. Tokenisez la chaîne text_lower et enregistrez le résultat dans tokens.
  4. Chargez les mots vides anglais, convertissez-les en set et enregistrez-les dans stop_words.
  5. Filtrez les mots vides à l'aide d'une compréhension de liste et enregistrez le résultat dans filtered_tokens.
  6. Créez un Porter Stemmer et enregistrez-le dans stemmer.
  7. Appliquez la racinisation sur les jetons à l'aide d'une compréhension de liste et enregistrez le résultat dans stemmed_tokens.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookDéfi : Racinisation

Glissez pour afficher le menu

Tâche

Swipe to start coding

Vous disposez d'un texte dans la variable text. Votre tâche consiste à tokeniser ce texte, à supprimer les mots vides, puis à appliquer la racinisation (stemming) sur les jetons. Pour cela :

  1. Importez le Porter Stemmer.
  2. Convertissez text en minuscules et enregistrez-le dans text_lower.
  3. Tokenisez la chaîne text_lower et enregistrez le résultat dans tokens.
  4. Chargez les mots vides anglais, convertissez-les en set et enregistrez-les dans stop_words.
  5. Filtrez les mots vides à l'aide d'une compréhension de liste et enregistrez le résultat dans filtered_tokens.
  6. Créez un Porter Stemmer et enregistrez-le dans stemmer.
  7. Appliquez la racinisation sur les jetons à l'aide d'une compréhension de liste et enregistrez le résultat dans stemmed_tokens.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 2
single

single

some-alt