Défi : Création d'Embeddings de Mots
Swipe to start coding
Vous disposez d'un corpus de texte stocké dans la variable corpus. Votre tâche consiste à entraîner un modèle Word2Vec afin de générer des embeddings de mots pour ce corpus. Pour cela :
- Importez la classe permettant de créer un modèle Word2Vec.
- Tokenisez chaque phrase de la colonne
'Document'ducorpusen divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variablesentences. - Initialisez le modèle Word2Vec en passant
sentencescomme premier argument et en définissant les paramètres suivants :- taille des embeddings : 50 ;
- taille de la fenêtre de contexte : 2 ;
- fréquence minimale des mots à inclure dans le modèle : 1 ;
- modèle : skip-gram.
- Affichez les 3 mots les plus similaires au mot 'bowl'.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain this in simpler terms?
What are some examples related to this topic?
Where can I learn more about this?
Awesome!
Completion rate improved to 3.45
Défi : Création d'Embeddings de Mots
Glissez pour afficher le menu
Swipe to start coding
Vous disposez d'un corpus de texte stocké dans la variable corpus. Votre tâche consiste à entraîner un modèle Word2Vec afin de générer des embeddings de mots pour ce corpus. Pour cela :
- Importez la classe permettant de créer un modèle Word2Vec.
- Tokenisez chaque phrase de la colonne
'Document'ducorpusen divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variablesentences. - Initialisez le modèle Word2Vec en passant
sentencescomme premier argument et en définissant les paramètres suivants :- taille des embeddings : 50 ;
- taille de la fenêtre de contexte : 2 ;
- fréquence minimale des mots à inclure dans le modèle : 1 ;
- modèle : skip-gram.
- Affichez les 3 mots les plus similaires au mot 'bowl'.
Solution
Merci pour vos commentaires !
single