Desafío: TF-IDF
Tarea
Swipe to start coding
Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importe la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancie la clase
TfidfVectorizercomotfidf_vectorizery configúrela para incluir unigrams, bigrams y trigrams. - Utilice el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy almacene el resultado en la variabletfidf_matrix. - Convierta
tfidf_matrixa un array denso y cree unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Almacene el resultado en la variabletfidf_matrix_df. - Muestre el vector para
'medical'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 8
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.45
Desafío: TF-IDF
Desliza para mostrar el menú
Tarea
Swipe to start coding
Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importe la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancie la clase
TfidfVectorizercomotfidf_vectorizery configúrela para incluir unigrams, bigrams y trigrams. - Utilice el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy almacene el resultado en la variabletfidf_matrix. - Convierta
tfidf_matrixa un array denso y cree unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Almacene el resultado en la variabletfidf_matrix_df. - Muestre el vector para
'medical'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 8
single