Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Påse med Ord | Grundläggande Textmodeller
Introduktion till NLP

bookUtmaning: Påse med Ord

Uppgift

Swipe to start coding

Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:

  1. Importera klassen CountVectorizer för att skapa en BoW-modell.
  2. Instansiera klassen CountVectorizer som count_vectorizer och konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram.
  3. Använd lämplig metod från count_vectorizer för att generera en BoW-matris från kolumnen 'Document' i corpus och spara resultatet i bow_matrix.
  4. Konvertera bow_matrix till en tät array och skapa en DataFrame från den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabeln bow_df.
  5. Visa vektorn för bigrammet 'graphic design' som en array.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 5
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

Awesome!

Completion rate improved to 3.45

bookUtmaning: Påse med Ord

Svep för att visa menyn

Uppgift

Swipe to start coding

Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:

  1. Importera klassen CountVectorizer för att skapa en BoW-modell.
  2. Instansiera klassen CountVectorizer som count_vectorizer och konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram.
  3. Använd lämplig metod från count_vectorizer för att generera en BoW-matris från kolumnen 'Document' i corpus och spara resultatet i bow_matrix.
  4. Konvertera bow_matrix till en tät array och skapa en DataFrame från den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabeln bow_df.
  5. Visa vektorn för bigrammet 'graphic design' som en array.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 5
single

single

some-alt