Avsnitt 1. Kapitel 25
single
Utmaning: TF-IDF
Svep för att visa menyn
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för unigrammet 'medical' i en TF-IDF-modell med unigrams, bigrams och trigrams. För att göra detta:
- Importera klassen
TfidfVectorizerför att skapa en TF-IDF-modell. - Instansiera klassen
TfidfVectorizersomtfidf_vectorizeroch konfigurera den för att inkludera unigrams, bigrams och trigrams. - Använd lämplig metod för
tfidf_vectorizerför att generera en TF-IDF-matris från kolumnen'Document'icorpusoch lagra resultatet itfidf_matrix. - Konvertera
tfidf_matrixtill en tät array och skapa enDataFramefrån den, där de unika funktionerna (termerna) används som kolumner. Spara resultatet i variabelntfidf_matrix_df. - Visa vektorn för
'medical'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 1. Kapitel 25
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal