Haaste: Sanapussimalli
Tehtävä
Swipe to start coding
Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on tarkastella bigrammia graphic design BoW-mallissa. Toimi näin:
- Tuo
CountVectorizer-luokka BoW-mallin luomista varten. - Luo
CountVectorizer-olio nimelläcount_vectorizerja määritä se käyttämään frekvenssipohjaista mallia, joka sisältää sekä unigrammit että bigrammit. - Käytä
count_vectorizer-olion sopivaa metodia luodaksesi BoW-matriisin'Document'-muuttujancorpus-sarakkeesta ja tallenna tulos muuttujaanbow_matrix. - Muunna
bow_matrixtiheäksi taulukoksi ja luo siitäDataFrame, jossa uniikit piirteet (unigrammit ja bigrammit) ovat sarakkeina. Tallenna tulos muuttujaanbow_df. - Näytä
'graphic design'-bigramin vektori taulukkona.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 3. Luku 5
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.45
Haaste: Sanapussimalli
Pyyhkäise näyttääksesi valikon
Tehtävä
Swipe to start coding
Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on tarkastella bigrammia graphic design BoW-mallissa. Toimi näin:
- Tuo
CountVectorizer-luokka BoW-mallin luomista varten. - Luo
CountVectorizer-olio nimelläcount_vectorizerja määritä se käyttämään frekvenssipohjaista mallia, joka sisältää sekä unigrammit että bigrammit. - Käytä
count_vectorizer-olion sopivaa metodia luodaksesi BoW-matriisin'Document'-muuttujancorpus-sarakkeesta ja tallenna tulos muuttujaanbow_matrix. - Muunna
bow_matrixtiheäksi taulukoksi ja luo siitäDataFrame, jossa uniikit piirteet (unigrammit ja bigrammit) ovat sarakkeina. Tallenna tulos muuttujaanbow_df. - Näytä
'graphic design'-bigramin vektori taulukkona.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 3. Luku 5
single