Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: TF-IDF | Grundlæggende Tekstmodeller
Quizzes & Challenges
Quizzes
Challenges
/
Introduktion til NLP med Python

bookUdfordring: TF-IDF

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrampen 'medical' i en TF-IDF-model med unigramp, bigrammer og trigrammer. For at gøre dette:

  1. Importér klassen TfidfVectorizer for at oprette en TF-IDF-model.
  2. Instantier klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til at inkludere unigrammer, bigrammer og trigrammer.
  3. Brug den relevante metode fra tfidf_vectorizer til at generere en TF-IDF-matrix fra kolonnen 'Document' i corpus og gem resultatet i tfidf_matrix.
  4. Konvertér tfidf_matrix til et tæt array og opret en DataFrame ud fra det, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

bookUdfordring: TF-IDF

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for unigrampen 'medical' i en TF-IDF-model med unigramp, bigrammer og trigrammer. For at gøre dette:

  1. Importér klassen TfidfVectorizer for at oprette en TF-IDF-model.
  2. Instantier klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til at inkludere unigrammer, bigrammer og trigrammer.
  3. Brug den relevante metode fra tfidf_vectorizer til at generere en TF-IDF-matrix fra kolonnen 'Document' i corpus og gem resultatet i tfidf_matrix.
  4. Konvertér tfidf_matrix til et tæt array og opret en DataFrame ud fra det, hvor de unikke features (termer) sættes som kolonner. Gem resultatet i variablen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 8
single

single

some-alt