Desafío: Bolsa de Palabras
Tarea
Swipe to start coding
Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importe la clase
CountVectorizerpara crear un modelo BoW. - Instancie la clase
CountVectorizercomocount_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utilice el método apropiado de
count_vectorizerpara generar una matriz BoW a partir de la columna'Document'en elcorpusy almacene el resultado enbow_matrix. - Convierta
bow_matrixa un array denso y cree unDataFramea partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Almacene el resultado en la variablebow_df. - Muestre el vector para el bigrama
'graphic design'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 5
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Suggested prompts:
Can you explain this in simpler terms?
What are the main points I should remember?
Can you give me an example?
Awesome!
Completion rate improved to 3.45
Desafío: Bolsa de Palabras
Desliza para mostrar el menú
Tarea
Swipe to start coding
Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importe la clase
CountVectorizerpara crear un modelo BoW. - Instancie la clase
CountVectorizercomocount_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utilice el método apropiado de
count_vectorizerpara generar una matriz BoW a partir de la columna'Document'en elcorpusy almacene el resultado enbow_matrix. - Convierta
bow_matrixa un array denso y cree unDataFramea partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Almacene el resultado en la variablebow_df. - Muestre el vector para el bigrama
'graphic design'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 5
single