Utfordring: Bag of Words
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus
. Din oppgave er å vise vektoren for bigrammet 'graphic design' i en BoW-modell. For å gjøre dette:
- Importer klassen
CountVectorizer
for å lage en BoW-modell. - Instansier klassen
CountVectorizer
somcount_vectorizer
, og konfigurer den for en frekvensbasert modell som inkluderer både unigrammer og bigrammer. - Bruk riktig metode fra
count_vectorizer
for å generere en BoW-matrise fra kolonnen'Document'
icorpus
, og lagre resultatet ibow_matrix
. - Konverter
bow_matrix
til et tett array og opprett enDataFrame
fra dette, med de unike trekkene (unigrammer og bigrammer) som kolonner. Lagre resultatet i variabelenbow_df
. - Vis vektoren for bigrammet
'graphic design'
som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 5
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.45
Utfordring: Bag of Words
Sveip for å vise menyen
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus
. Din oppgave er å vise vektoren for bigrammet 'graphic design' i en BoW-modell. For å gjøre dette:
- Importer klassen
CountVectorizer
for å lage en BoW-modell. - Instansier klassen
CountVectorizer
somcount_vectorizer
, og konfigurer den for en frekvensbasert modell som inkluderer både unigrammer og bigrammer. - Bruk riktig metode fra
count_vectorizer
for å generere en BoW-matrise fra kolonnen'Document'
icorpus
, og lagre resultatet ibow_matrix
. - Konverter
bow_matrix
til et tett array og opprett enDataFrame
fra dette, med de unike trekkene (unigrammer og bigrammer) som kolonner. Lagre resultatet i variabelenbow_df
. - Vis vektoren for bigrammet
'graphic design'
som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 5
single