Udfordring: TF-IDF
Opgave
Swipe to start coding
Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrammet 'medical' i en TF-IDF-model med unigrams, bigrams og trigrams. For at gøre dette:
- Importér klassen
TfidfVectorizerfor at oprette en TF-IDF-model. - Instantiér klassen
TfidfVectorizersomtfidf_vectorizerog konfigurer den til at inkludere unigrams, bigrams og trigrams. - Brug den relevante metode fra
tfidf_vectorizertil at generere en TF-IDF-matrix ud fra kolonnen'Document'icorpus, og gem resultatet itfidf_matrix. - Konvertér
tfidf_matrixtil et tæt array og opret enDataFrameud fra dette, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablentfidf_matrix_df. - Vis vektoren for
'medical'som et array.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 3. Kapitel 8
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Suggested prompts:
Can you explain this in simpler terms?
What are some examples related to this topic?
Where can I learn more about this?
Awesome!
Completion rate improved to 3.45
Udfordring: TF-IDF
Stryg for at vise menuen
Opgave
Swipe to start coding
Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrammet 'medical' i en TF-IDF-model med unigrams, bigrams og trigrams. For at gøre dette:
- Importér klassen
TfidfVectorizerfor at oprette en TF-IDF-model. - Instantiér klassen
TfidfVectorizersomtfidf_vectorizerog konfigurer den til at inkludere unigrams, bigrams og trigrams. - Brug den relevante metode fra
tfidf_vectorizertil at generere en TF-IDF-matrix ud fra kolonnen'Document'icorpus, og gem resultatet itfidf_matrix. - Konvertér
tfidf_matrixtil et tæt array og opret enDataFrameud fra dette, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablentfidf_matrix_df. - Vis vektoren for
'medical'som et array.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 3. Kapitel 8
single