Utmaning: TF-IDF
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för unigrammet 'medical' i en TF-IDF-modell med unigramp, bigram och trigram. För att göra detta:
- Importera klassen
TfidfVectorizerför att skapa en TF-IDF-modell. - Instansiera klassen
TfidfVectorizersomtfidf_vectorizeroch konfigurera den för att inkludera unigram, bigram och trigram. - Använd lämplig metod från
tfidf_vectorizerför att generera en TF-IDF-matris från kolumnen'Document'icorpusoch lagra resultatet itfidf_matrix. - Konvertera
tfidf_matrixtill en tät array och skapa enDataFramefrån den, där de unika funktionerna (termerna) används som kolumner. Spara resultatet i variabelntfidf_matrix_df. - Visa vektorn för
'medical'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 8
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.45
Utmaning: TF-IDF
Svep för att visa menyn
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för unigrammet 'medical' i en TF-IDF-modell med unigramp, bigram och trigram. För att göra detta:
- Importera klassen
TfidfVectorizerför att skapa en TF-IDF-modell. - Instansiera klassen
TfidfVectorizersomtfidf_vectorizeroch konfigurera den för att inkludera unigram, bigram och trigram. - Använd lämplig metod från
tfidf_vectorizerför att generera en TF-IDF-matris från kolumnen'Document'icorpusoch lagra resultatet itfidf_matrix. - Konvertera
tfidf_matrixtill en tät array och skapa enDataFramefrån den, där de unika funktionerna (termerna) används som kolumner. Spara resultatet i variabelntfidf_matrix_df. - Visa vektorn för
'medical'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 8
single