Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: TF-IDF | Grundlæggende Tekstmodeller
Introduktion til NLP

bookUdfordring: TF-IDF

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrammet 'medical' i en TF-IDF-model med unigrams, bigrams og trigrams. For at gøre dette:

  1. Importér klassen TfidfVectorizer for at oprette en TF-IDF-model.
  2. Instantiér klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til at inkludere unigrams, bigrams og trigrams.
  3. Brug den relevante metode fra tfidf_vectorizer til at generere en TF-IDF-matrix ud fra kolonnen 'Document' i corpus, og gem resultatet i tfidf_matrix.
  4. Konvertér tfidf_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: TF-IDF

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrammet 'medical' i en TF-IDF-model med unigrams, bigrams og trigrams. For at gøre dette:

  1. Importér klassen TfidfVectorizer for at oprette en TF-IDF-model.
  2. Instantiér klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til at inkludere unigrams, bigrams og trigrams.
  3. Brug den relevante metode fra tfidf_vectorizer til at generere en TF-IDF-matrix ud fra kolonnen 'Document' i corpus, og gem resultatet i tfidf_matrix.
  4. Konvertér tfidf_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 8
single

single

some-alt