Contenu du cours
Introduction au NLP
Introduction au NLP
Défi : Créer un Sac de Mots
Swipe to start coding
Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :
-
Importez la classe
CountVectorizer
pour créer un modèle BoW. -
Instanciez la classe
CountVectorizer
en tant quecount_vectorizer
, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes. -
Utilisez la méthode appropriée de
count_vectorizer
pour générer une matrice BoW à partir de la colonne'Document'
dans lecorpus
. -
Convertissez
bow_matrix
en un tableau dense et créez unDataFrame
à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variablebow_df
. -
Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une
Series
pandas.
Solution
Merci pour vos commentaires !
Défi : Créer un Sac de Mots
Swipe to start coding
Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :
-
Importez la classe
CountVectorizer
pour créer un modèle BoW. -
Instanciez la classe
CountVectorizer
en tant quecount_vectorizer
, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes. -
Utilisez la méthode appropriée de
count_vectorizer
pour générer une matrice BoW à partir de la colonne'Document'
dans lecorpus
. -
Convertissez
bow_matrix
en un tableau dense et créez unDataFrame
à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variablebow_df
. -
Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une
Series
pandas.
Solution
Merci pour vos commentaires !