Seksjon 1. Kapittel 25
single
Utfordring: TF-IDF
Sveip for å vise menyen
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Oppgaven din er å vise vektoren for unigrammet 'medical' i en TF-IDF-modell med unigrames, bigrames og trigrames. For å gjøre dette:
- Importer klassen
TfidfVectorizerfor å lage en TF-IDF-modell. - Instansier klassen
TfidfVectorizersomtfidf_vectorizerog konfigurer den til å inkludere unigrames, bigrames og trigrames. - Bruk riktig metode fra
tfidf_vectorizerfor å generere en TF-IDF-matrise fra kolonnen'Document'icorpus, og lagre resultatet itfidf_matrix. - Konverter
tfidf_matrixtil et tett array og opprett enDataFramefra dette, med de unike trekkene (termene) som kolonner. Lagre resultatet i variabelentfidf_matrix_df. - Vis vektoren for
'medical'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 1. Kapittel 25
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår