Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Créer des Embeddings de Mots | Incorporations de Mots
Introduction au NLP
course content

Contenu du cours

Introduction au NLP

Introduction au NLP

1. Fondamentaux du Prétraitement de Texte
2. Racine et Lemmatisation
3. Modèles de Texte de Base
4. Incorporations de Mots

book
Défi : Créer des Embeddings de Mots

Tâche

Swipe to start coding

Maintenant, il est temps pour vous d'entraîner un modèle Word2Vec pour générer des embeddings de mots pour le corpus donné :

  1. Importez la classe pour créer un modèle Word2Vec.
  2. Tokenisez chaque phrase dans la colonne 'Document' du corpus en divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variable sentences.
  3. Initialisez le modèle Word2Vec en passant sentences comme premier argument et en définissant les valeurs suivantes comme arguments de mots-clés, dans cet ordre :
    • taille de l'embedding : 50;
    • taille de la fenêtre de contexte : 2;
    • fréquence minimale des mots à inclure dans le modèle : 1;
    • modèle : skip-gram.
  4. Imprimez les 3 mots les plus similaires au mot 'bowl'.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 4
toggle bottom row

book
Défi : Créer des Embeddings de Mots

Tâche

Swipe to start coding

Maintenant, il est temps pour vous d'entraîner un modèle Word2Vec pour générer des embeddings de mots pour le corpus donné :

  1. Importez la classe pour créer un modèle Word2Vec.
  2. Tokenisez chaque phrase dans la colonne 'Document' du corpus en divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variable sentences.
  3. Initialisez le modèle Word2Vec en passant sentences comme premier argument et en définissant les valeurs suivantes comme arguments de mots-clés, dans cet ordre :
    • taille de l'embedding : 50;
    • taille de la fenêtre de contexte : 2;
    • fréquence minimale des mots à inclure dans le modèle : 1;
    • modèle : skip-gram.
  4. Imprimez les 3 mots les plus similaires au mot 'bowl'.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 4
Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
We're sorry to hear that something went wrong. What happened?
some-alt