Architektúra neurónovej siete použitá v príklade je dopredná neurónová sieť s tromi vrstvami: vstupná vrstva, skrytá vrstva a výstupná vrstva. Vstupná vrstva pozostáva zo 784 jednotiek, čo zodpovedá počtu pixelov vo vstupnom obrázku. Každá jednotka vo vstupnej vrstve predstavuje hodnotu intenzity pixelu na obrázku.
Skrytá vrstva pozostáva zo 128 jednotiek, ktoré sú plne prepojené so vstupnou vrstvou. Každá jednotka v skrytej vrstve vypočíta vážený súčet vstupov zo vstupnej vrstvy a použije aktivačnú funkciu na vytvorenie výstupu. V tomto príklade je aktivačnou funkciou použitou v skrytej vrstve funkcia rektifikovaných lineárnych jednotiek (ReLU). Funkcia ReLU je definovaná ako f(x) = max(0, x), kde x je vážený súčet vstupov do jednotky. Funkcia ReLU zavádza do siete nelinearitu, čo jej umožňuje naučiť sa zložité vzorce a vzťahy v údajoch.
Výstupná vrstva pozostáva z 10 jednotiek, z ktorých každá predstavuje jednu z možných tried v klasifikačnom probléme. Jednotky vo výstupnej vrstve sú tiež plne prepojené s jednotkami v skrytej vrstve. Podobne ako pri skrytej vrstve, každá jednotka vo výstupnej vrstve vypočítava vážený súčet vstupov zo skrytej vrstvy a aplikuje aktivačnú funkciu. V tomto príklade je aktivačnou funkciou používanou vo výstupnej vrstve funkcia softmax. Funkcia softmax prevádza vážený súčet vstupov na rozdelenie pravdepodobnosti cez triedy, kde súčet pravdepodobností je rovný 1. Jednotka s najvyššou pravdepodobnosťou predstavuje predpovedanú triedu vstupného obrazu.
Aby sme to zhrnuli, architektúra neurónovej siete použitá v príklade pozostáva zo vstupnej vrstvy so 784 jednotkami, skrytej vrstvy so 128 jednotkami pomocou aktivačnej funkcie ReLU a výstupnej vrstvy s 10 jednotkami pomocou aktivačnej funkcie softmax.
Ďalšie nedávne otázky a odpovede týkajúce sa Budovanie neurónovej siete na vykonávanie klasifikácie:
- Je potrebné použiť funkciu asynchrónneho učenia pre modely strojového učenia spustené v TensorFlow.js?
- Ako sa model zostavuje a trénuje v TensorFlow.js a aká je úloha funkcie straty kategorickej krížovej entropie?
- Aký význam má rýchlosť učenia a počet epoch v procese strojového učenia?
- Ako sú v TensorFlow.js rozdelené tréningové údaje na tréningové a testovacie sady?
- Aký je účel TensorFlow.js pri budovaní neurónovej siete pre klasifikačné úlohy?