Kursinhalt
Durchführung einer Explorativen Datenanalyse der Nobelpreise
Durchführung einer Explorativen Datenanalyse der Nobelpreise
Motivationsanalyse
In diesem Abschnitt konzentrieren wir uns darauf, den Text zu untersuchen, um die am häufigsten vorkommenden Wörter in unserem Datensatz zu identifizieren. Zunächst werden wir alle Stoppwörter aus der "motivation"
-Spalte entfernen und unsere Daten entsprechend anpassen.
Nehmen Sie zum Beispiel den Satz: "I like reading, so I read." Er wird zu: "Like Reading Read." Nach dieser Transformation werden wir diese Wörter in einer Wortwolke visualisieren, wobei die Größe jedes Wortes dessen Häufigkeit in unserem Datensatz widerspiegelt.
Swipe to start coding
-
Wende eine Lambda-Funktion an, um Stoppwörter aus der
'motivation'
-Spalte zu entfernen und den verarbeiteten Text in der'Filtered motivation'
-Spalte zu speichern. -
Füge alle Einträge in der
"Filtered motivation"
-Spalte zu einem einzigen Textstring zusammen. -
Teile den zusammengefügten Text in einzelne Wörter auf und erstelle ein pandas DataFrame aus der Liste der Wörter.
-
Berechne die Wortfrequenz, indem du die Vorkommen jedes Wortes zählst.
-
Erstelle ein Balkendiagramm der 20 am häufigsten vorkommenden Wörter unter Verwendung von
seaborn
'sbarplot
.
Lösung
Danke für Ihr Feedback!