Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Bolsa de Palabras | Modelos Básicos de Texto
Introducción al NLP con Python

bookDesafío: Bolsa de Palabras

Tarea

Swipe to start coding

Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:

  1. Importe la clase CountVectorizer para crear un modelo BoW.
  2. Instancie la clase CountVectorizer como count_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas.
  3. Utilice el método apropiado de count_vectorizer para generar una matriz BoW a partir de la columna 'Document' en el corpus y almacene el resultado en bow_matrix.
  4. Convierta bow_matrix a un array denso y cree un DataFrame a partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Almacene el resultado en la variable bow_df.
  5. Muestre el vector para el bigrama 'graphic design' como un array.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 5
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you explain this in simpler terms?

What are the main points I should remember?

Can you give me an example?

close

bookDesafío: Bolsa de Palabras

Desliza para mostrar el menú

Tarea

Swipe to start coding

Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:

  1. Importe la clase CountVectorizer para crear un modelo BoW.
  2. Instancie la clase CountVectorizer como count_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas.
  3. Utilice el método apropiado de count_vectorizer para generar una matriz BoW a partir de la columna 'Document' en el corpus y almacene el resultado en bow_matrix.
  4. Convierta bow_matrix a un array denso y cree un DataFrame a partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Almacene el resultado en la variable bow_df.
  5. Muestre el vector para el bigrama 'graphic design' como un array.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 5
single

single

some-alt