Haaste: TF-IDF
Tehtävä
Swipe to start coding
Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:
- Tuo
TfidfVectorizer-luokka TF-IDF-mallin luomista varten. - Luo
TfidfVectorizer-olio kutsumallatfidf_vectorizer-konstruktoria ja määritä se sisältämään unigrammit, bigrammit ja trigrammit. - Käytä
tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin'Document'-muuttujancorpus-sarakkeesta ja tallenna tulostfidf_matrix-muuttujaan. - Muunna
tfidf_matrixtiheäksi taulukoksi ja luo siitäDataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaantfidf_matrix_df. - Näytä
'medical'-termin vektori taulukkona.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 3. Luku 8
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Suggested prompts:
Can you explain this in simpler terms?
What are some examples related to this topic?
Where can I learn more about this?
Awesome!
Completion rate improved to 3.45
Haaste: TF-IDF
Pyyhkäise näyttääksesi valikon
Tehtävä
Swipe to start coding
Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:
- Tuo
TfidfVectorizer-luokka TF-IDF-mallin luomista varten. - Luo
TfidfVectorizer-olio kutsumallatfidf_vectorizer-konstruktoria ja määritä se sisältämään unigrammit, bigrammit ja trigrammit. - Käytä
tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin'Document'-muuttujancorpus-sarakkeesta ja tallenna tulostfidf_matrix-muuttujaan. - Muunna
tfidf_matrixtiheäksi taulukoksi ja luo siitäDataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaantfidf_matrix_df. - Näytä
'medical'-termin vektori taulukkona.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 3. Luku 8
single