Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Lemmatisation avec Étiquetage des POS | Racine et Lemmatisation
Introduction au TALN

bookDéfi : Lemmatisation avec Étiquetage des POS

Tâche

Swipe to start coding

Vous disposez d'un texte dans la variable text. Votre tâche consiste à effectuer une lemmatisation avec des étiquettes de parties du discours (POS) sur ce texte. Pour cela :

  1. Convertir text en minuscules et enregistrer le résultat dans text_lower.
  2. Tokeniser la chaîne text_lower et enregistrer le résultat dans tokens.
  3. Charger les stop words anglais, les convertir en set, et enregistrer dans stop_words.
  4. Filtrer les stop words à l'aide d'une compréhension de liste et enregistrer le résultat dans filtered_tokens.
  5. Effectuer le POS tagging à l'aide de la fonction appropriée et enregistrer le résultat dans tagged_tokens.
  6. Créer un lemmatiseur WordNet et l'enregistrer dans lemmatizer.
  7. Lemmatiser les tokens en tenant compte de leurs étiquettes POS à l'aide d'une compréhension de liste et enregistrer le résultat dans lemmatized_tokens.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookDéfi : Lemmatisation avec Étiquetage des POS

Glissez pour afficher le menu

Tâche

Swipe to start coding

Vous disposez d'un texte dans la variable text. Votre tâche consiste à effectuer une lemmatisation avec des étiquettes de parties du discours (POS) sur ce texte. Pour cela :

  1. Convertir text en minuscules et enregistrer le résultat dans text_lower.
  2. Tokeniser la chaîne text_lower et enregistrer le résultat dans tokens.
  3. Charger les stop words anglais, les convertir en set, et enregistrer dans stop_words.
  4. Filtrer les stop words à l'aide d'une compréhension de liste et enregistrer le résultat dans filtered_tokens.
  5. Effectuer le POS tagging à l'aide de la fonction appropriée et enregistrer le résultat dans tagged_tokens.
  6. Créer un lemmatiseur WordNet et l'enregistrer dans lemmatizer.
  7. Lemmatiser les tokens en tenant compte de leurs étiquettes POS à l'aide d'une compréhension de liste et enregistrer le résultat dans lemmatized_tokens.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

some-alt