Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: TF-IDF | Modelos Básicos de Texto
Introdução ao PLN

bookDesafio: TF-IDF

Tarefa

Swipe to start coding

Você possui um corpus de texto armazenado na variável corpus. Sua tarefa é exibir o vetor para o unigram 'medical' em um modelo TF-IDF com unigrams, bigrams e trigrams. Para isso:

  1. Importe a classe TfidfVectorizer para criar um modelo TF-IDF.
  2. Instancie a classe TfidfVectorizer como tfidf_vectorizer e configure-a para incluir unigrams, bigrams e trigrams.
  3. Utilize o método apropriado de tfidf_vectorizer para gerar uma matriz TF-IDF a partir da coluna 'Document' em corpus e armazene o resultado em tfidf_matrix.
  4. Converta tfidf_matrix para um array denso e crie um DataFrame a partir dele, definindo as features únicas (termos) como colunas. Armazene o resultado na variável tfidf_matrix_df.
  5. Exiba o vetor para 'medical' como um array.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 8
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookDesafio: TF-IDF

Deslize para mostrar o menu

Tarefa

Swipe to start coding

Você possui um corpus de texto armazenado na variável corpus. Sua tarefa é exibir o vetor para o unigram 'medical' em um modelo TF-IDF com unigrams, bigrams e trigrams. Para isso:

  1. Importe a classe TfidfVectorizer para criar um modelo TF-IDF.
  2. Instancie a classe TfidfVectorizer como tfidf_vectorizer e configure-a para incluir unigrams, bigrams e trigrams.
  3. Utilize o método apropriado de tfidf_vectorizer para gerar uma matriz TF-IDF a partir da coluna 'Document' em corpus e armazene o resultado em tfidf_matrix.
  4. Converta tfidf_matrix para um array denso e crie um DataFrame a partir dele, definindo as features únicas (termos) como colunas. Armazene o resultado na variável tfidf_matrix_df.
  5. Exiba o vetor para 'medical' como um array.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 8
single

single

some-alt