Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: TF-IDF | Basis Tekstmodellen
Introductie tot NLP

bookUitdaging: TF-IDF

Taak

Swipe to start coding

Je beschikt over een tekstcorpus opgeslagen in de variabele corpus. De opdracht is om de vector voor het unigram 'medical' weer te geven in een TF-IDF-model met unigrams, bigrams en trigrams. Volg hiervoor de volgende stappen:

  1. Importeer de klasse TfidfVectorizer om een TF-IDF-model te maken.
  2. Instantieer de klasse TfidfVectorizer als tfidf_vectorizer en configureer deze om unigrams, bigrams en trigrams op te nemen.
  3. Gebruik de juiste methode van tfidf_vectorizer om een TF-IDF-matrix te genereren uit de kolom 'Document' in het corpus en sla het resultaat op in tfidf_matrix.
  4. Zet tfidf_matrix om naar een dense array en maak hiervan een DataFrame, waarbij de unieke features (termen) als kolommen worden ingesteld. Sla het resultaat op in de variabele tfidf_matrix_df.
  5. Geef de vector voor 'medical' weer als een array.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 8
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookUitdaging: TF-IDF

Veeg om het menu te tonen

Taak

Swipe to start coding

Je beschikt over een tekstcorpus opgeslagen in de variabele corpus. De opdracht is om de vector voor het unigram 'medical' weer te geven in een TF-IDF-model met unigrams, bigrams en trigrams. Volg hiervoor de volgende stappen:

  1. Importeer de klasse TfidfVectorizer om een TF-IDF-model te maken.
  2. Instantieer de klasse TfidfVectorizer als tfidf_vectorizer en configureer deze om unigrams, bigrams en trigrams op te nemen.
  3. Gebruik de juiste methode van tfidf_vectorizer om een TF-IDF-matrix te genereren uit de kolom 'Document' in het corpus en sla het resultaat op in tfidf_matrix.
  4. Zet tfidf_matrix om naar een dense array en maak hiervan een DataFrame, waarbij de unieke features (termen) als kolommen worden ingesteld. Sla het resultaat op in de variabele tfidf_matrix_df.
  5. Geef de vector voor 'medical' weer als een array.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 8
single

single

some-alt