Utmaning: Påse med Ord
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus
. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:
- Importera klassen
CountVectorizer
för att skapa en BoW-modell. - Instansiera klassen
CountVectorizer
somcount_vectorizer
och konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram. - Använd lämplig metod från
count_vectorizer
för att generera en BoW-matris från kolumnen'Document'
icorpus
och spara resultatet ibow_matrix
. - Konvertera
bow_matrix
till en tät array och skapa enDataFrame
från den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabelnbow_df
. - Visa vektorn för bigrammet
'graphic design'
som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 5
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.45
Utmaning: Påse med Ord
Svep för att visa menyn
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus
. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:
- Importera klassen
CountVectorizer
för att skapa en BoW-modell. - Instansiera klassen
CountVectorizer
somcount_vectorizer
och konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram. - Använd lämplig metod från
count_vectorizer
för att generera en BoW-matris från kolumnen'Document'
icorpus
och spara resultatet ibow_matrix
. - Konvertera
bow_matrix
till en tät array och skapa enDataFrame
från den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabelnbow_df
. - Visa vektorn för bigrammet
'graphic design'
som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 5
single