Défi : TF-IDF
Swipe to start coding
Vous disposez d'un corpus de textes stocké dans la variable corpus. Votre tâche consiste à afficher le vecteur pour l'unigramme 'medical' dans un modèle TF-IDF utilisant des unigrams, bigrams et trigrams. Pour cela :
- Importer la classe
TfidfVectorizerafin de créer un modèle TF-IDF. - Instancier la classe
TfidfVectorizersous le nomtfidf_vectorizeret la configurer pour inclure les unigrams, bigrams et trigrams. - Utiliser la méthode appropriée de
tfidf_vectorizerpour générer une matrice TF-IDF à partir de la colonne'Document'ducorpuset stocker le résultat danstfidf_matrix. - Convertir
tfidf_matrixen un tableau dense et créer unDataFrameà partir de celui-ci, en définissant les caractéristiques uniques (termes) comme colonnes. Stocker le résultat dans la variabletfidf_matrix_df. - Afficher le vecteur pour
'medical'sous forme de tableau.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain this in simpler terms?
What are some examples related to this topic?
Where can I learn more about this?
Awesome!
Completion rate improved to 3.45
Défi : TF-IDF
Glissez pour afficher le menu
Swipe to start coding
Vous disposez d'un corpus de textes stocké dans la variable corpus. Votre tâche consiste à afficher le vecteur pour l'unigramme 'medical' dans un modèle TF-IDF utilisant des unigrams, bigrams et trigrams. Pour cela :
- Importer la classe
TfidfVectorizerafin de créer un modèle TF-IDF. - Instancier la classe
TfidfVectorizersous le nomtfidf_vectorizeret la configurer pour inclure les unigrams, bigrams et trigrams. - Utiliser la méthode appropriée de
tfidf_vectorizerpour générer une matrice TF-IDF à partir de la colonne'Document'ducorpuset stocker le résultat danstfidf_matrix. - Convertir
tfidf_matrixen un tableau dense et créer unDataFrameà partir de celui-ci, en définissant les caractéristiques uniques (termes) comme colonnes. Stocker le résultat dans la variabletfidf_matrix_df. - Afficher le vecteur pour
'medical'sous forme de tableau.
Solution
Merci pour vos commentaires !
single