Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Oprettelse af Word Embeddings | Ordindlejringer
Introduktion til NLP

bookUdfordring: Oprettelse af Word Embeddings

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at træne en Word2Vec-model til at generere word embeddings for det givne korpus. For at gøre dette:

  1. Importér klassen til oprettelse af en Word2Vec-model.
  2. Tokenisér hver sætning i kolonnen 'Document' i corpus ved at opdele hver sætning i ord adskilt af mellemrum. Gem resultatet i variablen sentences.
  3. Initialisér Word2Vec-modellen ved at give sentences som første argument og indstille følgende parametre:
    • embedding-størrelse: 50;
    • kontekstvinduesstørrelse: 2;
    • minimal frekvens af ord for at inkludere dem i modellen: 1;
    • model: skip-gram.
  4. Udskriv de tre mest lignende ord til ordet 'bowl'.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 4
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: Oprettelse af Word Embeddings

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at træne en Word2Vec-model til at generere word embeddings for det givne korpus. For at gøre dette:

  1. Importér klassen til oprettelse af en Word2Vec-model.
  2. Tokenisér hver sætning i kolonnen 'Document' i corpus ved at opdele hver sætning i ord adskilt af mellemrum. Gem resultatet i variablen sentences.
  3. Initialisér Word2Vec-modellen ved at give sentences som første argument og indstille følgende parametre:
    • embedding-størrelse: 50;
    • kontekstvinduesstørrelse: 2;
    • minimal frekvens af ord for at inkludere dem i modellen: 1;
    • model: skip-gram.
  4. Udskriv de tre mest lignende ord til ordet 'bowl'.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 4
single

single

some-alt