Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: TF-IDF | Modelli di Testo di Base
Introduzione alla NLP

bookSfida: TF-IDF

Compito

Swipe to start coding

Hai a disposizione un corpus di testo memorizzato nella variabile corpus. Il tuo compito è visualizzare il vettore per l'unigramma 'medical' in un modello TF-IDF che includa unigrammi, bigrammi e trigrammi. Per farlo:

  1. Importa la classe TfidfVectorizer per creare un modello TF-IDF.
  2. Istanzia la classe TfidfVectorizer come tfidf_vectorizer e configurala per includere unigrammi, bigrammi e trigrammi.
  3. Utilizza il metodo appropriato di tfidf_vectorizer per generare una matrice TF-IDF dalla colonna 'Document' nel corpus e memorizza il risultato in tfidf_matrix.
  4. Converti tfidf_matrix in un array denso e crea un DataFrame a partire da esso, impostando le feature uniche (termini) come colonne. Memorizza il risultato nella variabile tfidf_matrix_df.
  5. Visualizza il vettore per 'medical' come array.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 8
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookSfida: TF-IDF

Scorri per mostrare il menu

Compito

Swipe to start coding

Hai a disposizione un corpus di testo memorizzato nella variabile corpus. Il tuo compito è visualizzare il vettore per l'unigramma 'medical' in un modello TF-IDF che includa unigrammi, bigrammi e trigrammi. Per farlo:

  1. Importa la classe TfidfVectorizer per creare un modello TF-IDF.
  2. Istanzia la classe TfidfVectorizer come tfidf_vectorizer e configurala per includere unigrammi, bigrammi e trigrammi.
  3. Utilizza il metodo appropriato di tfidf_vectorizer per generare una matrice TF-IDF dalla colonna 'Document' nel corpus e memorizza il risultato in tfidf_matrix.
  4. Converti tfidf_matrix in un array denso e crea un DataFrame a partire da esso, impostando le feature uniche (termini) come colonne. Memorizza il risultato nella variabile tfidf_matrix_df.
  5. Visualizza il vettore per 'medical' come array.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 8
single

single

some-alt