Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Bag of Words | Sektion
Natural Language Processing
Sektion 1. Kapitel 22
single

single

bookUdfordring: Bag of Words

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:

  1. Importér klassen CountVectorizer for at oprette en BoW-model.
  2. Instantier klassen CountVectorizer som count_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer.
  3. Brug den relevante metode fra count_vectorizer til at generere en BoW-matrix ud fra kolonnen 'Document' i corpus og gem resultatet i bow_matrix.
  4. Konvertér bow_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablen bow_df.
  5. Vis vektoren for bigrammet 'graphic design' som et array.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 22
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

some-alt