Abschnitt 1. Kapitel 25
single
Herausforderung: TF-IDF
Swipe um das Menü anzuzeigen
Aufgabe
Swipe to start coding
Ein Textkorpus ist in der Variablen corpus gespeichert. Die Aufgabe besteht darin, den Vektor für das Unigramm 'medical' in einem TF-IDF-Modell mit Unigrammen, Bigrammen und Trigrammen anzuzeigen. Vorgehensweise:
- Die Klasse
TfidfVectorizerimportieren, um ein TF-IDF-Modell zu erstellen. - Die Klasse
TfidfVectorizeralstfidf_vectorizerinstanziieren und so konfigurieren, dass Unigramme, Bigramme und Trigramme einbezogen werden. - Die geeignete Methode von
tfidf_vectorizerverwenden, um aus der Spalte'Document'imcorpuseine TF-IDF-Matrix zu erzeugen und das Ergebnis intfidf_matrixspeichern. tfidf_matrixin ein dichtes Array umwandeln und daraus einDataFrameerstellen, wobei die einzigartigen Merkmale (Terme) als Spalten gesetzt werden. Das Ergebnis in der Variablentfidf_matrix_dfspeichern.- Den Vektor für
'medical'als Array anzeigen.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 25
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen