Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: TF-IDF | Grundläggande Textmodeller
Quizzes & Challenges
Quizzes
Challenges
/
Introduktion till NLP med Python

bookUtmaning: TF-IDF

Uppgift

Swipe to start coding

Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för unigrammet 'medical' i en TF-IDF-modell med unigrames, bigram och trigram. För att göra detta:

  1. Importera klassen TfidfVectorizer för att skapa en TF-IDF-modell.
  2. Instansiera klassen TfidfVectorizer som tfidf_vectorizer och konfigurera den för att inkludera unigrames, bigram och trigram.
  3. Använd lämplig metod för tfidf_vectorizer för att generera en TF-IDF-matris från kolumnen 'Document' i corpus och lagra resultatet i tfidf_matrix.
  4. Konvertera tfidf_matrix till en tät array och skapa en DataFrame från den, där de unika funktionerna (termerna) används som kolumner. Spara resultatet i variabeln tfidf_matrix_df.
  5. Visa vektorn för 'medical' som en array.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 8
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

bookUtmaning: TF-IDF

Svep för att visa menyn

Uppgift

Swipe to start coding

Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för unigrammet 'medical' i en TF-IDF-modell med unigrames, bigram och trigram. För att göra detta:

  1. Importera klassen TfidfVectorizer för att skapa en TF-IDF-modell.
  2. Instansiera klassen TfidfVectorizer som tfidf_vectorizer och konfigurera den för att inkludera unigrames, bigram och trigram.
  3. Använd lämplig metod för tfidf_vectorizer för att generera en TF-IDF-matris från kolumnen 'Document' i corpus och lagra resultatet i tfidf_matrix.
  4. Konvertera tfidf_matrix till en tät array och skapa en DataFrame från den, där de unika funktionerna (termerna) används som kolumner. Spara resultatet i variabeln tfidf_matrix_df.
  5. Visa vektorn för 'medical' som en array.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 8
single

single

some-alt