single
Neuroverkon Toteutus
Pyyhkäise näyttääksesi valikon
Olet nyt saavuttanut vaiheen, jossa hallussasi on olennaiset TensorFlow-taidot omien neuroverkkojen rakentamiseen. Vaikka useimmat todelliset neuroverkot ovat monimutkaisia ja rakennetaan yleensä korkean tason kirjastoilla kuten Kerasilla, rakennamme tässä yksinkertaisen verkon käyttäen perustason TensorFlow-työkaluja. Tämä lähestymistapa tarjoaa käytännön kokemusta matriisien matalan tason käsittelystä, mikä auttaa ymmärtämään taustalla olevia prosesseja.
Aiemmilla kursseilla, kuten Johdatus neuroverkkoihin, saatat muistaa, kuinka paljon aikaa ja vaivaa yksinkertaisenkin neuroverkon rakentaminen vaati, kun jokainen neuroni käsiteltiin erikseen.
TensorFlow yksinkertaistaa tätä prosessia merkittävästi. Käyttämällä tensoreita voidaan kapseloida monimutkaiset laskutoimitukset, mikä vähentää monimutkaisen koodin tarvetta. Päätehtävänä on rakentaa peräkkäinen tensorilaskujen ketju.
Tässä lyhyt kertaus vaiheista, joilla neuroverkon koulutusprosessi saadaan käyntiin:
Datan valmistelu ja mallin luominen
Neuroverkon koulutuksen alkuvaiheessa suoritetaan datan valmistelu, joka kattaa sekä syötteet että tulosteet, joista verkko oppii. Lisäksi määritellään mallin hyperparametrit – nämä ovat parametreja, jotka pysyvät muuttumattomina koko koulutusprosessin ajan. Painot alustetaan, yleensä normaalijakaumasta, ja bias-termit asetetaan usein nollaksi.
Eteenpäinlevitys
Eteenpäinlevityksessä jokainen verkon kerros noudattaa tyypillisesti seuraavia vaiheita:
- Kerro kerroksen syöte sen painoilla.
- Lisää tulokseen bias.
- Käytä tähän summaan aktivointifunktiota.
Tämän jälkeen voidaan laskea häviö.
Takaisinkulku
Seuraava vaihe on takaisinkulku, jossa painoja ja bias-arvoja säädetään niiden vaikutuksen perusteella häviöön. Tätä vaikutusta kuvaa gradientti, jonka TensorFlow'n Gradient Tape laskee automaattisesti. Päivitämme painot ja bias-arvot vähentämällä gradientin, kerrottuna oppimisnopeudella.
Koulutussilmukka
Neuroverkon tehokkaaseen kouluttamiseen koulutusvaiheet toistetaan useita kertoja samalla, kun mallin suorituskykyä seurataan. Ihanteellisesti häviön tulisi pienentyä epookkien aikana.
Swipe to start coding
Luo neuroverkko, joka on suunniteltu ennustamaan XOR-operaation tuloksia. Verkossa tulee olla 2 syöteneuronia, piilokerros, jossa on 2 neuronia, sekä 1 ulostuloneuroni.
- Aloita alkuperäisten painojen ja biasien asettamisella. Painot tulee alustaa käyttäen normaalijakaumaa, ja biasit alustetaan kaikki nollaksi. Käytä hyperparametreja
input_size,hidden_sizejaoutput_sizemäärittääksesi tensorien oikeat muodot. - Hyödynnä funktiokoristetta muuntaaksesi
train_step()-funktion TensorFlow'n graafiksi. - Suorita eteenpäinlevitys sekä piilo- että ulostulokerroksen läpi. Käytä sigmoid-aktivointifunktiota.
- Määritä gradientit selvittääksesi, miten kukin paino ja bias vaikuttaa tappioon. Varmista, että gradientit lasketaan oikeassa järjestyksessä vastaamaan ulostulomuuttujien nimiä.
- Muokkaa painoja ja biaseja niiden vastaavien gradienttien perusteella. Ota huomioon
learning_ratepäivitysprosessissa, jotta voit hallita kunkin päivityksen suuruutta.
Ratkaisu
Yhteenveto
Koska XOR-funktio on suhteellisen yksinkertainen tehtävä, emme tässä vaiheessa tarvitse edistyneitä tekniikoita, kuten hyperparametrien säätöä, aineiston jakamista tai monimutkaisten dataputkien rakentamista. Tämä harjoitus on vain yksi askel kohti kehittyneempien neuroverkkojen rakentamista todellisiin sovelluksiin.
Näiden perusteiden hallinta on olennaista ennen siirtymistä edistyneisiin neuroverkkotekniikoihin tulevilla kursseilla, joissa käytämme Keras-kirjastoa ja tutkimme tapoja parantaa mallin laatua TensorFlow'n monipuolisten ominaisuuksien avulla.
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme