Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: TF-IDF | Grundlæggende Tekstmodeller
Introduktion til NLP

bookUdfordring: TF-IDF

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrammet 'medical' i en TF-IDF-model med unigrams, bigrams og trigrams. For at gøre dette:

  1. Importér klassen TfidfVectorizer for at oprette en TF-IDF-model.
  2. Instantiér klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til at inkludere unigrams, bigrams og trigrams.
  3. Brug den relevante metode fra tfidf_vectorizer til at generere en TF-IDF-matrix ud fra kolonnen 'Document' i corpus, og gem resultatet i tfidf_matrix.
  4. Konvertér tfidf_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: TF-IDF

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrammet 'medical' i en TF-IDF-model med unigrams, bigrams og trigrams. For at gøre dette:

  1. Importér klassen TfidfVectorizer for at oprette en TF-IDF-model.
  2. Instantiér klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til at inkludere unigrams, bigrams og trigrams.
  3. Brug den relevante metode fra tfidf_vectorizer til at generere en TF-IDF-matrix ud fra kolonnen 'Document' i corpus, og gem resultatet i tfidf_matrix.
  4. Konvertér tfidf_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 8
single

single

some-alt