Desafío: TF-IDF
Tarea
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importa la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancia la clase
TfidfVectorizercomotfidf_vectorizery configúrala para incluir unigrams, bigrams y trigrams. - Utiliza el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy guarda el resultado entfidf_matrix. - Convierte
tfidf_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Guarda el resultado en la variabletfidf_matrix_df. - Muestra el vector para
'medical'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 8
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.45
Desafío: TF-IDF
Desliza para mostrar el menú
Tarea
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importa la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancia la clase
TfidfVectorizercomotfidf_vectorizery configúrala para incluir unigrams, bigrams y trigrams. - Utiliza el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy guarda el resultado entfidf_matrix. - Convierte
tfidf_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Guarda el resultado en la variabletfidf_matrix_df. - Muestra el vector para
'medical'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 8
single