Sección 1. Capítulo 22
single
Desafío: Bolsa de Palabras
Desliza para mostrar el menú
Tarea
Desliza para comenzar a programar
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importa la clase
CountVectorizerpara crear un modelo BoW. - Instancia la clase
CountVectorizercomocount_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utiliza el método apropiado de
count_vectorizerpara generar una matriz BoW a partir de la columna'Document'en elcorpusy guarda el resultado enbow_matrix. - Convierte
bow_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Guarda el resultado en la variablebow_df. - Muestra el vector para el bigrama
'graphic design'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 1. Capítulo 22
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla