Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: TF-IDF | Grundlegende Textmodelle
Einführung in NLP

bookHerausforderung: TF-IDF

Aufgabe

Swipe to start coding

Sie verfügen über ein Textkorpus, das in der Variablen corpus gespeichert ist. Ihre Aufgabe besteht darin, den Vektor für das Unigramm 'medical' in einem TF-IDF-Modell mit Unigrammen, Bigrammen und Trigrammen anzuzeigen. Gehen Sie dazu wie folgt vor:

  1. Import der Klasse TfidfVectorizer, um ein TF-IDF-Modell zu erstellen.
  2. Instanziieren Sie die Klasse TfidfVectorizer als tfidf_vectorizer und konfigurieren Sie sie so, dass Unigramme, Bigramme und Trigramme einbezogen werden.
  3. Verwenden Sie die geeignete Methode von tfidf_vectorizer, um aus der Spalte 'Document' im corpus eine TF-IDF-Matrix zu erzeugen, und speichern Sie das Ergebnis in tfidf_matrix.
  4. Konvertieren Sie tfidf_matrix in ein dichtes Array und erstellen Sie daraus ein DataFrame, wobei Sie die einzigartigen Merkmale (Terme) als Spalten setzen. Speichern Sie das Ergebnis in der Variablen tfidf_matrix_df.
  5. Zeigen Sie den Vektor für 'medical' als Array an.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 8
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookHerausforderung: TF-IDF

Swipe um das Menü anzuzeigen

Aufgabe

Swipe to start coding

Sie verfügen über ein Textkorpus, das in der Variablen corpus gespeichert ist. Ihre Aufgabe besteht darin, den Vektor für das Unigramm 'medical' in einem TF-IDF-Modell mit Unigrammen, Bigrammen und Trigrammen anzuzeigen. Gehen Sie dazu wie folgt vor:

  1. Import der Klasse TfidfVectorizer, um ein TF-IDF-Modell zu erstellen.
  2. Instanziieren Sie die Klasse TfidfVectorizer als tfidf_vectorizer und konfigurieren Sie sie so, dass Unigramme, Bigramme und Trigramme einbezogen werden.
  3. Verwenden Sie die geeignete Methode von tfidf_vectorizer, um aus der Spalte 'Document' im corpus eine TF-IDF-Matrix zu erzeugen, und speichern Sie das Ergebnis in tfidf_matrix.
  4. Konvertieren Sie tfidf_matrix in ein dichtes Array und erstellen Sie daraus ein DataFrame, wobei Sie die einzigartigen Merkmale (Terme) als Spalten setzen. Speichern Sie das Ergebnis in der Variablen tfidf_matrix_df.
  5. Zeigen Sie den Vektor für 'medical' als Array an.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 8
single

single

some-alt