Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Créer un Sac de Mots | Modèles de Texte de Base
Introduction au NLP

Glissez pour afficher le menu

book
Défi : Créer un Sac de Mots

Tâche

Swipe to start coding

Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :

  1. Importez la classe CountVectorizer pour créer un modèle BoW.

  2. Instanciez la classe CountVectorizer en tant que count_vectorizer, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes.

  3. Utilisez la méthode appropriée de count_vectorizer pour générer une matrice BoW à partir de la colonne 'Document' dans le corpus.

  4. Convertissez bow_matrix en un tableau dense et créez un DataFrame à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variable bow_df.

  5. Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une Series pandas.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5

Demandez à l'IA

expand
ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

book
Défi : Créer un Sac de Mots

Tâche

Swipe to start coding

Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :

  1. Importez la classe CountVectorizer pour créer un modèle BoW.

  2. Instanciez la classe CountVectorizer en tant que count_vectorizer, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes.

  3. Utilisez la méthode appropriée de count_vectorizer pour générer une matrice BoW à partir de la colonne 'Document' dans le corpus.

  4. Convertissez bow_matrix en un tableau dense et créez un DataFrame à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variable bow_df.

  5. Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une Series pandas.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5
Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Nous sommes désolés de vous informer que quelque chose s'est mal passé. Qu'est-il arrivé ?
some-alt