Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Challenge: Creating a Bag of Words | Basic Text Models
Introduction to NLP

Свайпніть щоб показати меню

book
Challenge: Creating a Bag of Words

Завдання

Swipe to start coding

Your task is to display the vector for the 'graphic design' bigram in a BoW model:

  1. Import the CountVectorizer class to create a BoW model.

  2. Instantiate the CountVectorizer class as count_vectorizer, configuring it for a frequency-based model that includes both unigrams and bigrams.

  3. Utilize the appropriate method of count_vectorizer to generate a BoW matrix from the 'Document' column in the corpus.

  4. Convert bow_matrix to a dense array and create a DataFrame from it, setting the unique features (unigrams and bigrams) as its columns. Assign this to the variable bow_df.

  5. Display the vector for 'graphic design' as an array, rather than as a pandas Series.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5
Ми дуже хвилюємося, що щось пішло не так. Що трапилося?

Запитати АІ

expand
ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

book
Challenge: Creating a Bag of Words

Завдання

Swipe to start coding

Your task is to display the vector for the 'graphic design' bigram in a BoW model:

  1. Import the CountVectorizer class to create a BoW model.

  2. Instantiate the CountVectorizer class as count_vectorizer, configuring it for a frequency-based model that includes both unigrams and bigrams.

  3. Utilize the appropriate method of count_vectorizer to generate a BoW matrix from the 'Document' column in the corpus.

  4. Convert bow_matrix to a dense array and create a DataFrame from it, setting the unique features (unigrams and bigrams) as its columns. Assign this to the variable bow_df.

  5. Display the vector for 'graphic design' as an array, rather than as a pandas Series.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5
Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Ми дуже хвилюємося, що щось пішло не так. Що трапилося?
some-alt