Haaste: TF-IDF
Tehtävä
Swipe to start coding
Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:
- Tuo
TfidfVectorizer-luokka TF-IDF-mallin luomista varten. - Luo
TfidfVectorizer-olio kutsumallatfidf_vectorizer-konstruktoria ja määritä se sisältämään unigrammit, bigrammit ja trigrammit. - Käytä
tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin'Document'-muuttujancorpus-sarakkeesta ja tallenna tulostfidf_matrix-muuttujaan. - Muunna
tfidf_matrixtiheäksi taulukoksi ja luo siitäDataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaantfidf_matrix_df. - Näytä
'medical'-termin vektori taulukkona.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 3. Luku 8
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.45
Haaste: TF-IDF
Pyyhkäise näyttääksesi valikon
Tehtävä
Swipe to start coding
Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:
- Tuo
TfidfVectorizer-luokka TF-IDF-mallin luomista varten. - Luo
TfidfVectorizer-olio kutsumallatfidf_vectorizer-konstruktoria ja määritä se sisältämään unigrammit, bigrammit ja trigrammit. - Käytä
tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin'Document'-muuttujancorpus-sarakkeesta ja tallenna tulostfidf_matrix-muuttujaan. - Muunna
tfidf_matrixtiheäksi taulukoksi ja luo siitäDataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaantfidf_matrix_df. - Näytä
'medical'-termin vektori taulukkona.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 3. Luku 8
single