Herausforderung: Bag of Words
Aufgabe
Swipe to start coding
Sie verfügen über ein Textkorpus, das in der Variablen corpus gespeichert ist. Ihre Aufgabe ist es, den Vektor für das Bigramm 'graphic design' in einem BoW-Modell anzuzeigen. Gehen Sie dazu wie folgt vor:
- Importieren Sie die Klasse
CountVectorizer, um ein BoW-Modell zu erstellen. - Instanziieren Sie die Klasse
CountVectorizeralscount_vectorizerund konfigurieren Sie sie für ein frequenzbasiertes Modell, das sowohl Unigramme als auch Bigramme umfasst. - Verwenden Sie die geeignete Methode von
count_vectorizer, um aus der Spalte'Document'imcorpuseine BoW-Matrix zu erzeugen, und speichern Sie das Ergebnis inbow_matrix. - Konvertieren Sie
bow_matrixin ein dichtes Array und erstellen Sie daraus einDataFrame, wobei Sie die einzigartigen Merkmale (Unigramme und Bigramme) als Spalten festlegen. Speichern Sie das Ergebnis in der Variablenbow_df. - Zeigen Sie den Vektor für das Bigramm
'graphic design'als Array an.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 3. Kapitel 5
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.45
Herausforderung: Bag of Words
Swipe um das Menü anzuzeigen
Aufgabe
Swipe to start coding
Sie verfügen über ein Textkorpus, das in der Variablen corpus gespeichert ist. Ihre Aufgabe ist es, den Vektor für das Bigramm 'graphic design' in einem BoW-Modell anzuzeigen. Gehen Sie dazu wie folgt vor:
- Importieren Sie die Klasse
CountVectorizer, um ein BoW-Modell zu erstellen. - Instanziieren Sie die Klasse
CountVectorizeralscount_vectorizerund konfigurieren Sie sie für ein frequenzbasiertes Modell, das sowohl Unigramme als auch Bigramme umfasst. - Verwenden Sie die geeignete Methode von
count_vectorizer, um aus der Spalte'Document'imcorpuseine BoW-Matrix zu erzeugen, und speichern Sie das Ergebnis inbow_matrix. - Konvertieren Sie
bow_matrixin ein dichtes Array und erstellen Sie daraus einDataFrame, wobei Sie die einzigartigen Merkmale (Unigramme und Bigramme) als Spalten festlegen. Speichern Sie das Ergebnis in der Variablenbow_df. - Zeigen Sie den Vektor für das Bigramm
'graphic design'als Array an.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 3. Kapitel 5
single