Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : TF-IDF | Modèles de Texte de Base
Introduction au TALN

bookDéfi : TF-IDF

Tâche

Swipe to start coding

Vous disposez d'un corpus de textes stocké dans la variable corpus. Votre tâche consiste à afficher le vecteur pour l'unigramme 'medical' dans un modèle TF-IDF utilisant des unigrams, bigrams et trigrams. Pour cela :

  1. Importer la classe TfidfVectorizer afin de créer un modèle TF-IDF.
  2. Instancier la classe TfidfVectorizer sous le nom tfidf_vectorizer et la configurer pour inclure les unigrams, bigrams et trigrams.
  3. Utiliser la méthode appropriée de tfidf_vectorizer pour générer une matrice TF-IDF à partir de la colonne 'Document' du corpus et stocker le résultat dans tfidf_matrix.
  4. Convertir tfidf_matrix en un tableau dense et créer un DataFrame à partir de celui-ci, en définissant les caractéristiques uniques (termes) comme colonnes. Stocker le résultat dans la variable tfidf_matrix_df.
  5. Afficher le vecteur pour 'medical' sous forme de tableau.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 8
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookDéfi : TF-IDF

Glissez pour afficher le menu

Tâche

Swipe to start coding

Vous disposez d'un corpus de textes stocké dans la variable corpus. Votre tâche consiste à afficher le vecteur pour l'unigramme 'medical' dans un modèle TF-IDF utilisant des unigrams, bigrams et trigrams. Pour cela :

  1. Importer la classe TfidfVectorizer afin de créer un modèle TF-IDF.
  2. Instancier la classe TfidfVectorizer sous le nom tfidf_vectorizer et la configurer pour inclure les unigrams, bigrams et trigrams.
  3. Utiliser la méthode appropriée de tfidf_vectorizer pour générer une matrice TF-IDF à partir de la colonne 'Document' du corpus et stocker le résultat dans tfidf_matrix.
  4. Convertir tfidf_matrix en un tableau dense et créer un DataFrame à partir de celui-ci, en définissant les caractéristiques uniques (termes) comme colonnes. Stocker le résultat dans la variable tfidf_matrix_df.
  5. Afficher le vecteur pour 'medical' sous forme de tableau.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 8
single

single

some-alt