Seksjon 1. Kapittel 22
single
Utfordring: Bag of Words
Sveip for å vise menyen
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Din oppgave er å vise vektoren for bigrammet 'graphic design' i en BoW-modell. For å gjøre dette:
- Importer klassen
CountVectorizerfor å lage en BoW-modell. - Instansier
CountVectorizer-klassen somcount_vectorizer, konfigurert for en frekvensbasert modell som inkluderer både unigrammer og bigrammer. - Bruk riktig metode fra
count_vectorizerfor å generere en BoW-matrise fra kolonnen'Document'icorpus, og lagre resultatet ibow_matrix. - Konverter
bow_matrixtil et tett array og opprett enDataFramefra dette, der de unike trekkene (unigrammer og bigrammer) settes som kolonner. Lagre resultatet i variabelenbow_df. - Vis vektoren for bigrammet
'graphic design'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 1. Kapittel 22
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår