Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Bag of Words | Grunnleggende Tekstmodeller
Introduksjon til NLP

bookUtfordring: Bag of Words

Oppgave

Swipe to start coding

Du har et tekstkorpus lagret i variabelen corpus. Din oppgave er å vise vektoren for bigrammet 'graphic design' i en BoW-modell. For å gjøre dette:

  1. Importer klassen CountVectorizer for å lage en BoW-modell.
  2. Instansier klassen CountVectorizer som count_vectorizer, og konfigurer den for en frekvensbasert modell som inkluderer både unigrammer og bigrammer.
  3. Bruk riktig metode fra count_vectorizer for å generere en BoW-matrise fra kolonnen 'Document' i corpus, og lagre resultatet i bow_matrix.
  4. Konverter bow_matrix til et tett array og opprett en DataFrame fra dette, med de unike trekkene (unigrammer og bigrammer) som kolonner. Lagre resultatet i variabelen bow_df.
  5. Vis vektoren for bigrammet 'graphic design' som et array.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 5
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 3.45

bookUtfordring: Bag of Words

Sveip for å vise menyen

Oppgave

Swipe to start coding

Du har et tekstkorpus lagret i variabelen corpus. Din oppgave er å vise vektoren for bigrammet 'graphic design' i en BoW-modell. For å gjøre dette:

  1. Importer klassen CountVectorizer for å lage en BoW-modell.
  2. Instansier klassen CountVectorizer som count_vectorizer, og konfigurer den for en frekvensbasert modell som inkluderer både unigrammer og bigrammer.
  3. Bruk riktig metode fra count_vectorizer for å generere en BoW-matrise fra kolonnen 'Document' i corpus, og lagre resultatet i bow_matrix.
  4. Konverter bow_matrix til et tett array og opprett en DataFrame fra dette, med de unike trekkene (unigrammer og bigrammer) som kolonner. Lagre resultatet i variabelen bow_df.
  5. Vis vektoren for bigrammet 'graphic design' som et array.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 5
single

single

some-alt