Avsnitt 1. Kapitel 22
single
Utmaning: Bag of Words
Svep för att visa menyn
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:
- Importera klassen
CountVectorizerför att skapa en BoW-modell. - Skapa en instans av klassen
CountVectorizersomcount_vectorizer, konfigurerad för en frekvensbaserad modell som inkluderar både unigram och bigram. - Använd lämplig metod från
count_vectorizerför att generera en BoW-matris från kolumnen'Document'icorpusoch lagra resultatet ibow_matrix. - Konvertera
bow_matrixtill en tät array och skapa enDataFramefrån den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabelnbow_df. - Visa vektorn för bigrammet
'graphic design'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 1. Kapitel 22
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal