Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: TF-IDF | Osio
Luonnollisen Kielen Käsittely
Osio 1. Luku 25
single

single

bookHaaste: TF-IDF

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää medical-unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:

  1. Tuo TfidfVectorizer-luokka TF-IDF-mallin luomista varten.
  2. Luo TfidfVectorizer-olio nimellä tfidf_vectorizer ja määritä se sisältämään unigrammit, bigrammit ja trigrammit.
  3. Käytä tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin 'Document'-muuttujan corpus-sarakkeesta ja tallenna tulos muuttujaan tfidf_matrix.
  4. Muunna tfidf_matrix tiheäksi taulukoksi ja luo siitä DataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaan tfidf_matrix_df.
  5. Näytä 'medical'-termin vektori taulukkona.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 25
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

some-alt