Sektion 1. Kapitel 22
single
Udfordring: Bag of Words
Stryg for at vise menuen
Opgave
Swipe to start coding
Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:
- Importér klassen
CountVectorizerfor at oprette en BoW-model. - Instantier klassen
CountVectorizersomcount_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer. - Brug den relevante metode fra
count_vectorizertil at generere en BoW-matrix ud fra kolonnen'Document'icorpusog gem resultatet ibow_matrix. - Konvertér
bow_matrixtil et tæt array og opret enDataFrameud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablenbow_df. - Vis vektoren for bigrammet
'graphic design'som et array.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 1. Kapitel 22
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat