Sección 1. Capítulo 25
single
Desafío: TF-IDF
Desliza para mostrar el menú
Tarea
Desliza para comenzar a programar
Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importe la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancie la clase
TfidfVectorizercomotfidf_vectorizery configúrela para incluir unigrams, bigrams y trigrams. - Utilice el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy almacene el resultado entfidf_matrix. - Convierta
tfidf_matrixa un array denso y cree unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Almacene el resultado en la variabletfidf_matrix_df. - Muestre el vector para
'medical'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 1. Capítulo 25
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla