Sección 3. Capítulo 8
single
Desafío: TF-IDF
Desliza para mostrar el menú
Tarea
Desliza para comenzar a programar
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importa la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancia la clase
TfidfVectorizercomotfidf_vectorizery configúrala para incluir unigrams, bigrams y trigrams. - Utiliza el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy guarda el resultado entfidf_matrix. - Convierte
tfidf_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Guarda el resultado en la variabletfidf_matrix_df. - Muestra el vector para
'medical'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 8
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla