Utfordring: TF-IDF
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Oppgaven din er å vise vektoren for unigrammet 'medical' i en TF-IDF-modell med unigrames, bigrames og trigrames. For å gjøre dette:
- Importer klassen
TfidfVectorizerfor å opprette en TF-IDF-modell. - Instansier klassen
TfidfVectorizersomtfidf_vectorizerog konfigurer den til å inkludere unigrammer, bigrammer og trigrammer. - Bruk riktig metode fra
tfidf_vectorizerfor å generere en TF-IDF-matrise fra kolonnen'Document'icorpus, og lagre resultatet itfidf_matrix. - Konverter
tfidf_matrixtil et tett array og opprett enDataFramefra dette, der de unike trekkene (termene) settes som kolonner. Lagre resultatet i variabelentfidf_matrix_df. - Vis vektoren for
'medical'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 8
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.45
Utfordring: TF-IDF
Sveip for å vise menyen
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Oppgaven din er å vise vektoren for unigrammet 'medical' i en TF-IDF-modell med unigrames, bigrames og trigrames. For å gjøre dette:
- Importer klassen
TfidfVectorizerfor å opprette en TF-IDF-modell. - Instansier klassen
TfidfVectorizersomtfidf_vectorizerog konfigurer den til å inkludere unigrammer, bigrammer og trigrammer. - Bruk riktig metode fra
tfidf_vectorizerfor å generere en TF-IDF-matrise fra kolonnen'Document'icorpus, og lagre resultatet itfidf_matrix. - Konverter
tfidf_matrixtil et tett array og opprett enDataFramefra dette, der de unike trekkene (termene) settes som kolonner. Lagre resultatet i variabelentfidf_matrix_df. - Vis vektoren for
'medical'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 8
single