Contenu du cours
Conduire une Analyse Exploratoire des Données des Prix Nobel
Conduire une Analyse Exploratoire des Données des Prix Nobel
Analyse de la Motivation
Dans cette section, nous nous concentrerons sur l'examen du texte pour identifier les mots les plus fréquents de notre ensemble de données. Dans un premier temps, nous éliminerons tous les stopwords de la colonne "motivation"
et modifierons nos données en conséquence.
Prenons, par exemple, la phrase: "I like reading, so I read." Elle sera transformée en: "Like Reading Read." Suite à cette transformation, nous visualiserons ces mots dans un nuage de mots, où la taille de chaque mot reflète sa fréquence dans notre ensemble de données.
Swipe to start coding
-
Appliquez une fonction lambda pour supprimer les stopwords de la colonne
'motivation'
et stockez le texte traité dans la colonne'Filtered motivation'
. -
Concaténez toutes les entrées de la colonne
"Filtered motivation"
pour former une chaîne de texte unique. -
Divisez le texte concaténé en mots individuels et créez une DataFrame pandas à partir de la liste de mots.
-
Calculez la fréquence des mots en comptant le nombre d'occurrences de chaque mot.
-
Tracez les 20 mots les plus fréquents en utilisant
seaborn
'sbarplot
.
Solution
Merci pour vos commentaires !