Arhitektura neuronske mreže koja se koristi u primjeru je neuronska mreža s tri sloja: ulazni sloj, skriveni sloj i izlazni sloj. Ulazni sloj se sastoji od 784 jedinice, što odgovara broju piksela u ulaznoj slici. Svaka jedinica u ulaznom sloju predstavlja vrijednost intenziteta piksela na slici.
Skriveni sloj sastoji se od 128 jedinica, koje su u potpunosti povezane s ulaznim slojem. Svaka jedinica u skrivenom sloju izračunava ponderirani zbroj ulaza iz ulaznog sloja i primjenjuje aktivacijsku funkciju da proizvede izlaz. U ovom primjeru, funkcija aktivacije koja se koristi u skrivenom sloju je funkcija ispravljene linearne jedinice (ReLU). ReLU funkcija je definirana kao f(x) = max(0, x), gdje je x ponderirani zbroj ulaza u jedinicu. ReLU funkcija uvodi nelinearnost u mrežu, dopuštajući joj da nauči složene obrasce i odnose u podacima.
Izlazni sloj sastoji se od 10 jedinica, od kojih svaka predstavlja jednu od mogućih klasa u problemu klasifikacije. Jedinice u izlaznom sloju također su potpuno povezane s jedinicama u skrivenom sloju. Slično skrivenom sloju, svaka jedinica u izlaznom sloju izračunava ponderirani zbroj ulaza iz skrivenog sloja i primjenjuje funkciju aktivacije. U ovom primjeru, aktivacijska funkcija koja se koristi u izlaznom sloju je softmax funkcija. Funkcija softmax pretvara ponderirani zbroj ulaza u distribuciju vjerojatnosti po klasama, gdje je zbroj vjerojatnosti jednak 1. Jedinica s najvećom vjerojatnošću predstavlja predviđenu klasu ulazne slike.
Ukratko, arhitektura neuronske mreže korištena u primjeru sastoji se od ulaznog sloja sa 784 jedinice, skrivenog sloja sa 128 jedinica koje koriste ReLU aktivacijsku funkciju i izlaznog sloja s 10 jedinica koje koriste softmax aktivacijsku funkciju.
Ostala nedavna pitanja i odgovori u vezi Izgradnja neuronske mreže za obavljanje klasifikacije:
- Je li potrebno koristiti asinkronu funkciju učenja za modele strojnog učenja koji se izvode u TensorFlow.js?
- Kako se model sastavlja i obučava u TensorFlow.js i koja je uloga kategoričke funkcije unakrsnog entropijskog gubitka?
- Koja je važnost brzine učenja i broja epoha u procesu strojnog učenja?
- Kako se podaci o obuci dijele na skupove za obuku i test u TensorFlow.js?
- Koja je svrha TensorFlow.js u izgradnji neuronske mreže za zadatke klasifikacije?