Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: TF-IDF | Базові Текстові Моделі
Вступ до NLP

bookЗавдання: TF-IDF

Завдання

Swipe to start coding

У вас є текстовий корпус, збережений у змінній corpus. Ваше завдання — відобразити вектор для уніграми 'medical' у TF-IDF моделі з уніграмами, біграмами та тріграмами. Для цього:

  1. Імпортуйте клас TfidfVectorizer для створення TF-IDF моделі.
  2. Створіть екземпляр класу TfidfVectorizer під назвою tfidf_vectorizer і налаштуйте його для включення уніграм, біграм та тріграм.
  3. Використайте відповідний метод tfidf_vectorizer для створення TF-IDF матриці з колонки 'Document' у corpus та збережіть результат у змінній tfidf_matrix.
  4. Перетворіть tfidf_matrix у щільний масив і створіть з нього DataFrame, встановивши унікальні ознаки (терміни) як стовпці. Збережіть результат у змінній tfidf_matrix_df.
  5. Відобразіть вектор для 'medical' у вигляді масиву.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 8
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.45

bookЗавдання: TF-IDF

Свайпніть щоб показати меню

Завдання

Swipe to start coding

У вас є текстовий корпус, збережений у змінній corpus. Ваше завдання — відобразити вектор для уніграми 'medical' у TF-IDF моделі з уніграмами, біграмами та тріграмами. Для цього:

  1. Імпортуйте клас TfidfVectorizer для створення TF-IDF моделі.
  2. Створіть екземпляр класу TfidfVectorizer під назвою tfidf_vectorizer і налаштуйте його для включення уніграм, біграм та тріграм.
  3. Використайте відповідний метод tfidf_vectorizer для створення TF-IDF матриці з колонки 'Document' у corpus та збережіть результат у змінній tfidf_matrix.
  4. Перетворіть tfidf_matrix у щільний масив і створіть з нього DataFrame, встановивши унікальні ознаки (терміни) як стовпці. Збережіть результат у змінній tfidf_matrix_df.
  5. Відобразіть вектор для 'medical' у вигляді масиву.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 8
single

single

some-alt