Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Sacco di Parole | Modelli di Testo di Base
Introduzione alla NLP

bookSfida: Sacco di Parole

Compito

Swipe to start coding

Hai a disposizione un corpus di testo memorizzato nella variabile corpus. Il tuo compito è visualizzare il vettore per il bigramma 'graphic design' in un modello BoW. Per farlo:

  1. Importa la classe CountVectorizer per creare un modello BoW.
  2. Istanzia la classe CountVectorizer come count_vectorizer, configurandola per un modello basato sulla frequenza che includa sia unigrammi che bigrammi.
  3. Utilizza il metodo appropriato di count_vectorizer per generare una matrice BoW dalla colonna 'Document' in corpus e memorizza il risultato in bow_matrix.
  4. Converte bow_matrix in un array denso e crea un DataFrame da esso, impostando le feature uniche (unigrammi e bigrammi) come colonne. Memorizza il risultato nella variabile bow_df.
  5. Visualizza il vettore per il bigramma 'graphic design' come array.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 5
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain this in simpler terms?

What are the main points I should remember?

Can you give me an example?

close

Awesome!

Completion rate improved to 3.45

bookSfida: Sacco di Parole

Scorri per mostrare il menu

Compito

Swipe to start coding

Hai a disposizione un corpus di testo memorizzato nella variabile corpus. Il tuo compito è visualizzare il vettore per il bigramma 'graphic design' in un modello BoW. Per farlo:

  1. Importa la classe CountVectorizer per creare un modello BoW.
  2. Istanzia la classe CountVectorizer come count_vectorizer, configurandola per un modello basato sulla frequenza che includa sia unigrammi che bigrammi.
  3. Utilizza il metodo appropriato di count_vectorizer per generare una matrice BoW dalla colonna 'Document' in corpus e memorizza il risultato in bow_matrix.
  4. Converte bow_matrix in un array denso e crea un DataFrame da esso, impostando le feature uniche (unigrammi e bigrammi) come colonne. Memorizza il risultato nella variabile bow_df.
  5. Visualizza il vettore per il bigramma 'graphic design' come array.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 5
single

single

some-alt