Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: TF-IDF | Modelli di Testo di Base
Quizzes & Challenges
Quizzes
Challenges
/
Introduzione a NLP con Python

bookSfida: TF-IDF

Compito

Swipe to start coding

Si dispone di un corpus di testo memorizzato nella variabile corpus. L'obiettivo è visualizzare il vettore per l'unigramma 'medical' in un modello TF-IDF che includa unigrammi, bigrammi e trigrammi. Per procedere:

  1. Importare la classe TfidfVectorizer per creare un modello TF-IDF.
  2. Istanziare la classe TfidfVectorizer come tfidf_vectorizer e configurarla per includere unigrammi, bigrammi e trigrammi.
  3. Utilizzare il metodo appropriato di tfidf_vectorizer per generare una matrice TF-IDF dalla colonna 'Document' del corpus e memorizzare il risultato in tfidf_matrix.
  4. Convertire tfidf_matrix in un array denso e creare un DataFrame da esso, impostando le feature uniche (termini) come colonne. Salvare il risultato nella variabile tfidf_matrix_df.
  5. Visualizzare il vettore per 'medical' come array.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 8
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

bookSfida: TF-IDF

Scorri per mostrare il menu

Compito

Swipe to start coding

Si dispone di un corpus di testo memorizzato nella variabile corpus. L'obiettivo è visualizzare il vettore per l'unigramma 'medical' in un modello TF-IDF che includa unigrammi, bigrammi e trigrammi. Per procedere:

  1. Importare la classe TfidfVectorizer per creare un modello TF-IDF.
  2. Istanziare la classe TfidfVectorizer come tfidf_vectorizer e configurarla per includere unigrammi, bigrammi e trigrammi.
  3. Utilizzare il metodo appropriato di tfidf_vectorizer per generare una matrice TF-IDF dalla colonna 'Document' del corpus e memorizzare il risultato in tfidf_matrix.
  4. Convertire tfidf_matrix in un array denso e creare un DataFrame da esso, impostando le feature uniche (termini) come colonne. Salvare il risultato nella variabile tfidf_matrix_df.
  5. Visualizzare il vettore per 'medical' come array.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 8
single

single

some-alt