Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: TF-IDF | Grunnleggende Tekstmodeller
Introduksjon til NLP

bookUtfordring: TF-IDF

Oppgave

Swipe to start coding

Du har et tekstkorpus lagret i variabelen corpus. Oppgaven din er å vise vektoren for unigrammet 'medical' i en TF-IDF-modell med unigrames, bigrames og trigrames. For å gjøre dette:

  1. Importer klassen TfidfVectorizer for å opprette en TF-IDF-modell.
  2. Instansier klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til å inkludere unigrammer, bigrammer og trigrammer.
  3. Bruk riktig metode fra tfidf_vectorizer for å generere en TF-IDF-matrise fra kolonnen 'Document' i corpus, og lagre resultatet i tfidf_matrix.
  4. Konverter tfidf_matrix til et tett array og opprett en DataFrame fra dette, der de unike trekkene (termene) settes som kolonner. Lagre resultatet i variabelen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 8
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 3.45

bookUtfordring: TF-IDF

Sveip for å vise menyen

Oppgave

Swipe to start coding

Du har et tekstkorpus lagret i variabelen corpus. Oppgaven din er å vise vektoren for unigrammet 'medical' i en TF-IDF-modell med unigrames, bigrames og trigrames. For å gjøre dette:

  1. Importer klassen TfidfVectorizer for å opprette en TF-IDF-modell.
  2. Instansier klassen TfidfVectorizer som tfidf_vectorizer og konfigurer den til å inkludere unigrammer, bigrammer og trigrammer.
  3. Bruk riktig metode fra tfidf_vectorizer for å generere en TF-IDF-matrise fra kolonnen 'Document' i corpus, og lagre resultatet i tfidf_matrix.
  4. Konverter tfidf_matrix til et tett array og opprett en DataFrame fra dette, der de unike trekkene (termene) settes som kolonner. Lagre resultatet i variabelen tfidf_matrix_df.
  5. Vis vektoren for 'medical' som et array.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 8
single

single

some-alt