Herausforderung: TF-IDF
Swipe to start coding
Sie verfügen über ein Textkorpus, das in der Variablen corpus gespeichert ist. Ihre Aufgabe besteht darin, den Vektor für das Unigramm 'medical' in einem TF-IDF-Modell mit Unigrammen, Bigrammen und Trigrammen anzuzeigen. Gehen Sie dazu wie folgt vor:
- Import der Klasse
TfidfVectorizer, um ein TF-IDF-Modell zu erstellen. - Instanziieren Sie die Klasse
TfidfVectorizeralstfidf_vectorizerund konfigurieren Sie sie so, dass Unigramme, Bigramme und Trigramme einbezogen werden. - Verwenden Sie die geeignete Methode von
tfidf_vectorizer, um aus der Spalte'Document'imcorpuseine TF-IDF-Matrix zu erzeugen, und speichern Sie das Ergebnis intfidf_matrix. - Konvertieren Sie
tfidf_matrixin ein dichtes Array und erstellen Sie daraus einDataFrame, wobei Sie die einzigartigen Merkmale (Terme) als Spalten setzen. Speichern Sie das Ergebnis in der Variablentfidf_matrix_df. - Zeigen Sie den Vektor für
'medical'als Array an.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain this in simpler terms?
What are some examples related to this topic?
Where can I learn more about this?
Awesome!
Completion rate improved to 3.45
Herausforderung: TF-IDF
Swipe um das Menü anzuzeigen
Swipe to start coding
Sie verfügen über ein Textkorpus, das in der Variablen corpus gespeichert ist. Ihre Aufgabe besteht darin, den Vektor für das Unigramm 'medical' in einem TF-IDF-Modell mit Unigrammen, Bigrammen und Trigrammen anzuzeigen. Gehen Sie dazu wie folgt vor:
- Import der Klasse
TfidfVectorizer, um ein TF-IDF-Modell zu erstellen. - Instanziieren Sie die Klasse
TfidfVectorizeralstfidf_vectorizerund konfigurieren Sie sie so, dass Unigramme, Bigramme und Trigramme einbezogen werden. - Verwenden Sie die geeignete Methode von
tfidf_vectorizer, um aus der Spalte'Document'imcorpuseine TF-IDF-Matrix zu erzeugen, und speichern Sie das Ergebnis intfidf_matrix. - Konvertieren Sie
tfidf_matrixin ein dichtes Array und erstellen Sie daraus einDataFrame, wobei Sie die einzigartigen Merkmale (Terme) als Spalten setzen. Speichern Sie das Ergebnis in der Variablentfidf_matrix_df. - Zeigen Sie den Vektor für
'medical'als Array an.
Lösung
Danke für Ihr Feedback!
single