Desafio: Saco de Palavras
Tarefa
Swipe to start coding
Você possui um corpus de texto armazenado na variável corpus. Sua tarefa é exibir o vetor para o bigrama 'graphic design' em um modelo BoW. Para isso:
- Importe a classe
CountVectorizerpara criar um modelo BoW. - Instancie a classe
CountVectorizercomocount_vectorizer, configurando-a para um modelo baseado em frequência que inclua tanto unigramas quanto bigramas. - Utilize o método apropriado de
count_vectorizerpara gerar uma matriz BoW a partir da coluna'Document'emcorpuse armazene o resultado embow_matrix. - Converta
bow_matrixpara um array denso e crie umDataFramea partir dele, definindo as features únicas (unigramas e bigramas) como colunas. Armazene o resultado na variávelbow_df. - Exiba o vetor para o bigrama
'graphic design'como um array.
Solução
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 3. Capítulo 5
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Suggested prompts:
Can you explain this in simpler terms?
What are the main points I should remember?
Can you give me an example?
Awesome!
Completion rate improved to 3.45
Desafio: Saco de Palavras
Deslize para mostrar o menu
Tarefa
Swipe to start coding
Você possui um corpus de texto armazenado na variável corpus. Sua tarefa é exibir o vetor para o bigrama 'graphic design' em um modelo BoW. Para isso:
- Importe a classe
CountVectorizerpara criar um modelo BoW. - Instancie a classe
CountVectorizercomocount_vectorizer, configurando-a para um modelo baseado em frequência que inclua tanto unigramas quanto bigramas. - Utilize o método apropriado de
count_vectorizerpara gerar uma matriz BoW a partir da coluna'Document'emcorpuse armazene o resultado embow_matrix. - Converta
bow_matrixpara um array denso e crie umDataFramea partir dele, definindo as features únicas (unigramas e bigramas) como colunas. Armazene o resultado na variávelbow_df. - Exiba o vetor para o bigrama
'graphic design'como um array.
Solução
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 3. Capítulo 5
single