Sección 3. Capítulo 5
single
Desafío: Bolsa de Palabras
Desliza para mostrar el menú
Tarea
Desliza para comenzar a programar
Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importe la clase
CountVectorizerpara crear un modelo BoW. - Instancie la clase
CountVectorizercomocount_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utilice el método apropiado de
count_vectorizerpara generar una matriz BoW a partir de la columna'Document'en elcorpusy almacene el resultado enbow_matrix. - Convierta
bow_matrixa un array denso y cree unDataFramea partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Almacene el resultado en la variablebow_df. - Muestre el vector para el bigrama
'graphic design'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 5
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla