Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: TF-IDF | Abschnitt
Practice
Projects
Quizzes & Challenges
Quizze
Challenges
/
Verarbeitung natürlicher Sprache
Abschnitt 1. Kapitel 25
single

single

bookHerausforderung: TF-IDF

Swipe um das Menü anzuzeigen

Aufgabe

Swipe to start coding

Ein Textkorpus ist in der Variablen corpus gespeichert. Die Aufgabe besteht darin, den Vektor für das Unigramm 'medical' in einem TF-IDF-Modell mit Unigrammen, Bigrammen und Trigrammen anzuzeigen. Vorgehensweise:

  1. Die Klasse TfidfVectorizer importieren, um ein TF-IDF-Modell zu erstellen.
  2. Die Klasse TfidfVectorizer als tfidf_vectorizer instanziieren und so konfigurieren, dass Unigramme, Bigramme und Trigramme einbezogen werden.
  3. Die geeignete Methode von tfidf_vectorizer verwenden, um aus der Spalte 'Document' im corpus eine TF-IDF-Matrix zu erzeugen und das Ergebnis in tfidf_matrix speichern.
  4. tfidf_matrix in ein dichtes Array umwandeln und daraus ein DataFrame erstellen, wobei die einzigartigen Merkmale (Terme) als Spalten gesetzt werden. Das Ergebnis in der Variablen tfidf_matrix_df speichern.
  5. Den Vektor für 'medical' als Array anzeigen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 25
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

some-alt