Utmaning: Påse med Ord
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:
- Importera klassen
CountVectorizerför att skapa en BoW-modell. - Instansiera klassen
CountVectorizersomcount_vectorizeroch konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram. - Använd lämplig metod från
count_vectorizerför att generera en BoW-matris från kolumnen'Document'icorpusoch spara resultatet ibow_matrix. - Konvertera
bow_matrixtill en tät array och skapa enDataFramefrån den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabelnbow_df. - Visa vektorn för bigrammet
'graphic design'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 5
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.45
Utmaning: Påse med Ord
Svep för att visa menyn
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:
- Importera klassen
CountVectorizerför att skapa en BoW-modell. - Instansiera klassen
CountVectorizersomcount_vectorizeroch konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram. - Använd lämplig metod från
count_vectorizerför att generera en BoW-matris från kolumnen'Document'icorpusoch spara resultatet ibow_matrix. - Konvertera
bow_matrixtill en tät array och skapa enDataFramefrån den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabelnbow_df. - Visa vektorn för bigrammet
'graphic design'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 5
single