Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: TF-IDF | Perustekstin Mallit
Johdatus NLP:hen

bookHaaste: TF-IDF

Tehtävä

Swipe to start coding

Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:

  1. Tuo TfidfVectorizer-luokka TF-IDF-mallin luomista varten.
  2. Luo TfidfVectorizer-olio kutsumalla tfidf_vectorizer-konstruktoria ja määritä se sisältämään unigrammit, bigrammit ja trigrammit.
  3. Käytä tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin 'Document'-muuttujan corpus-sarakkeesta ja tallenna tulos tfidf_matrix-muuttujaan.
  4. Muunna tfidf_matrix tiheäksi taulukoksi ja luo siitä DataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaan tfidf_matrix_df.
  5. Näytä 'medical'-termin vektori taulukkona.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 8
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookHaaste: TF-IDF

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää unigrammin vektori TF-IDF-mallissa, jossa käytetään unigrammeja, bigrammeja ja trigrammeja. Toimi seuraavasti:

  1. Tuo TfidfVectorizer-luokka TF-IDF-mallin luomista varten.
  2. Luo TfidfVectorizer-olio kutsumalla tfidf_vectorizer-konstruktoria ja määritä se sisältämään unigrammit, bigrammit ja trigrammit.
  3. Käytä tfidf_vectorizer-olion sopivaa metodia luodaksesi TF-IDF-matriisin 'Document'-muuttujan corpus-sarakkeesta ja tallenna tulos tfidf_matrix-muuttujaan.
  4. Muunna tfidf_matrix tiheäksi taulukoksi ja luo siitä DataFrame, jossa uniikit termit ovat sarakkeina. Tallenna tulos muuttujaan tfidf_matrix_df.
  5. Näytä 'medical'-termin vektori taulukkona.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 8
single

single

some-alt