Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: TF-IDF | Sektion
Natural Language Processing
Sektion 1. Kapitel 25
single

single

bookUdfordring: TF-IDF

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrampen 'medical' i en TF-IDF-model med unigramp, bigrammer og trigrammer. For at gøre dette:

  1. Importér klassen TfidfVectorizer for at oprette en TF-IDF-model.
  2. Instantier klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til at inkludere unigrammer, bigrammer og trigrammer.
  3. Brug den relevante metode fra tfidf_vectorizer til at generere en TF-IDF-matrix ud fra kolonnen 'Document' i corpus og gem resultatet i tfidf_matrix.
  4. Konverter tfidf_matrix til et tæt array og opret en DataFrame ud fra det, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 25
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

some-alt