Sezione 1. Capitolo 25
single
Sfida: TF-IDF
Scorri per mostrare il menu
Compito
Swipe to start coding
Hai a disposizione un corpus di testo memorizzato nella variabile corpus. L'obiettivo è visualizzare il vettore relativo all'unigramma 'medical' in un modello TF-IDF che includa unigrammi, bigrammi e trigrammi. Per procedere:
- Importare la classe
TfidfVectorizerper creare un modello TF-IDF. - Istanziare la classe
TfidfVectorizercometfidf_vectorizere configurarla per includere unigrammi, bigrammi e trigrammi. - Utilizzare il metodo appropriato di
tfidf_vectorizerper generare una matrice TF-IDF dalla colonna'Document'delcorpuse memorizzare il risultato intfidf_matrix. - Convertire
tfidf_matrixin un array denso e creare unDataFramea partire da esso, impostando le feature uniche (termini) come colonne. Salvare il risultato nella variabiletfidf_matrix_df. - Visualizzare il vettore relativo a
'medical'come array.
Soluzione
Tutto è chiaro?
Grazie per i tuoi commenti!
Sezione 1. Capitolo 25
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione