Desafío: Bolsa de Palabras
Tarea
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus
. Tu tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importa la clase
CountVectorizer
para crear un modelo BoW. - Instancia la clase
CountVectorizer
comocount_vectorizer
, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utiliza el método apropiado de
count_vectorizer
para generar una matriz BoW a partir de la columna'Document'
encorpus
y guarda el resultado enbow_matrix
. - Convierte
bow_matrix
a un array denso y crea unDataFrame
a partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Guarda el resultado en la variablebow_df
. - Muestra el vector para el bigrama
'graphic design'
como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 5
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.45
Desafío: Bolsa de Palabras
Desliza para mostrar el menú
Tarea
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus
. Tu tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importa la clase
CountVectorizer
para crear un modelo BoW. - Instancia la clase
CountVectorizer
comocount_vectorizer
, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utiliza el método apropiado de
count_vectorizer
para generar una matriz BoW a partir de la columna'Document'
encorpus
y guarda el resultado enbow_matrix
. - Convierte
bow_matrix
a un array denso y crea unDataFrame
a partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Guarda el resultado en la variablebow_df
. - Muestra el vector para el bigrama
'graphic design'
como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 5
single