Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Zak van Woorden | Basis Tekstmodellen
Introductie tot NLP

bookUitdaging: Zak van Woorden

Taak

Swipe to start coding

Je beschikt over een tekstcorpus opgeslagen in de variabele corpus. Je taak is om de vector voor het bigram 'graphic design' weer te geven in een BoW-model. Volg hiervoor de volgende stappen:

  1. Importeer de klasse CountVectorizer om een BoW-model te maken.
  2. Instantieer de klasse CountVectorizer als count_vectorizer en configureer deze voor een frequentie-gebaseerd model dat zowel unigrammen als bigrammen bevat.
  3. Gebruik de juiste methode van count_vectorizer om een BoW-matrix te genereren uit de kolom 'Document' in het corpus en sla het resultaat op in bow_matrix.
  4. Zet bow_matrix om naar een dense array en maak hiervan een DataFrame, waarbij de unieke features (unigrammen en bigrammen) als kolommen worden ingesteld. Sla het resultaat op in de variabele bow_df.
  5. Geef de vector voor het bigram 'graphic design' weer als een array.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain this in simpler terms?

What are the main points I should remember?

Can you give me an example?

close

Awesome!

Completion rate improved to 3.45

bookUitdaging: Zak van Woorden

Veeg om het menu te tonen

Taak

Swipe to start coding

Je beschikt over een tekstcorpus opgeslagen in de variabele corpus. Je taak is om de vector voor het bigram 'graphic design' weer te geven in een BoW-model. Volg hiervoor de volgende stappen:

  1. Importeer de klasse CountVectorizer om een BoW-model te maken.
  2. Instantieer de klasse CountVectorizer als count_vectorizer en configureer deze voor een frequentie-gebaseerd model dat zowel unigrammen als bigrammen bevat.
  3. Gebruik de juiste methode van count_vectorizer om een BoW-matrix te genereren uit de kolom 'Document' in het corpus en sla het resultaat op in bow_matrix.
  4. Zet bow_matrix om naar een dense array en maak hiervan een DataFrame, waarbij de unieke features (unigrammen en bigrammen) als kolommen worden ingesteld. Sla het resultaat op in de variabele bow_df.
  5. Geef de vector voor het bigram 'graphic design' weer als een array.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5
single

single

some-alt