Contenu du cours
Introduction au NLP
Introduction au NLP
1. Fondamentaux du Prétraitement de Texte
Défi : Créer des Embeddings de Mots
Tâche
Swipe to start coding
Maintenant, il est temps pour vous d'entraîner un modèle Word2Vec pour générer des embeddings de mots pour le corpus donné :
- Importez la classe pour créer un modèle Word2Vec.
- Tokenisez chaque phrase dans la colonne
'Document'
ducorpus
en divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variablesentences
. - Initialisez le modèle Word2Vec en passant
sentences
comme premier argument et en définissant les valeurs suivantes comme arguments de mots-clés, dans cet ordre :- taille de l'embedding : 50;
- taille de la fenêtre de contexte : 2;
- fréquence minimale des mots à inclure dans le modèle : 1;
- modèle : skip-gram.
- Imprimez les 3 mots les plus similaires au mot 'bowl'.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 4
Défi : Créer des Embeddings de Mots
Tâche
Swipe to start coding
Maintenant, il est temps pour vous d'entraîner un modèle Word2Vec pour générer des embeddings de mots pour le corpus donné :
- Importez la classe pour créer un modèle Word2Vec.
- Tokenisez chaque phrase dans la colonne
'Document'
ducorpus
en divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variablesentences
. - Initialisez le modèle Word2Vec en passant
sentences
comme premier argument et en définissant les valeurs suivantes comme arguments de mots-clés, dans cet ordre :- taille de l'embedding : 50;
- taille de la fenêtre de contexte : 2;
- fréquence minimale des mots à inclure dans le modèle : 1;
- modèle : skip-gram.
- Imprimez les 3 mots les plus similaires au mot 'bowl'.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 4