Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: TF-IDF | Modelos Básicos de Texto
Introducción al PLN

bookDesafío: TF-IDF

Tarea

Swipe to start coding

Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:

  1. Importe la clase TfidfVectorizer para crear un modelo TF-IDF.
  2. Instancie la clase TfidfVectorizer como tfidf_vectorizer y configúrela para incluir unigrams, bigrams y trigrams.
  3. Utilice el método apropiado de tfidf_vectorizer para generar una matriz TF-IDF a partir de la columna 'Document' en el corpus y almacene el resultado en la variable tfidf_matrix.
  4. Convierta tfidf_matrix a un array denso y cree un DataFrame a partir de él, estableciendo las características únicas (términos) como columnas. Almacene el resultado en la variable tfidf_matrix_df.
  5. Muestre el vector para 'medical' como un array.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 8
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

Awesome!

Completion rate improved to 3.45

bookDesafío: TF-IDF

Desliza para mostrar el menú

Tarea

Swipe to start coding

Dispone de un corpus de texto almacenado en la variable corpus. Su tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:

  1. Importe la clase TfidfVectorizer para crear un modelo TF-IDF.
  2. Instancie la clase TfidfVectorizer como tfidf_vectorizer y configúrela para incluir unigrams, bigrams y trigrams.
  3. Utilice el método apropiado de tfidf_vectorizer para generar una matriz TF-IDF a partir de la columna 'Document' en el corpus y almacene el resultado en la variable tfidf_matrix.
  4. Convierta tfidf_matrix a un array denso y cree un DataFrame a partir de él, estableciendo las características únicas (términos) como columnas. Almacene el resultado en la variable tfidf_matrix_df.
  5. Muestre el vector para 'medical' como un array.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 8
single

single

some-alt