Osio 1. Luku 25
single
Haaste: TF-IDF
Pyyhkäise näyttääksesi valikon
Tehtävä
Swipe to start coding
Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää medical-unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:
- Tuo
TfidfVectorizer-luokka TF-IDF-mallin luomista varten. - Luo
TfidfVectorizer-olio nimellätfidf_vectorizerja määritä se sisältämään unigrammit, bigrammit ja trigrammit. - Käytä
tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin'Document'-muuttujancorpus-sarakkeesta ja tallenna tulos muuttujaantfidf_matrix. - Muunna
tfidf_matrixtiheäksi taulukoksi ja luo siitäDataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaantfidf_matrix_df. - Näytä
'medical'-termin vektori taulukkona.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 1. Luku 25
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme