Die argitektuur van die neurale netwerk wat in die voorbeeld gebruik word, is 'n voorwaartse neurale netwerk met drie lae: 'n invoerlaag, 'n versteekte laag en 'n uitsetlaag. Die invoerlaag bestaan uit 784 eenhede, wat ooreenstem met die aantal pixels in die invoerbeeld. Elke eenheid in die invoerlaag verteenwoordig die intensiteitswaarde van 'n pixel in die prent.
Die versteekte laag bestaan uit 128 eenhede, wat volledig aan die invoerlaag gekoppel is. Elke eenheid in die versteekte laag bereken 'n geweegde som van die insette van die invoerlaag en pas 'n aktiveringsfunksie toe om 'n uitset te produseer. In hierdie voorbeeld is die aktiveringsfunksie wat in die versteekte laag gebruik word, die reggestelde lineêre eenheid (ReLU) funksie. Die ReLU-funksie word gedefinieer as f(x) = maks(0, x), waar x die geweegde som van die insette na die eenheid is. Die ReLU-funksie stel nie-lineariteit aan die netwerk bekend, wat dit toelaat om komplekse patrone en verwantskappe in die data te leer.
Die uitsetlaag bestaan uit 10 eenhede, wat elk een van die moontlike klasse in die klassifikasieprobleem verteenwoordig. Die eenhede in die uitsetlaag is ook volledig gekoppel aan die eenhede in die versteekte laag. Soortgelyk aan die versteekte laag, bereken elke eenheid in die uitsetlaag 'n geweegde som van die insette van die versteekte laag en pas 'n aktiveringsfunksie toe. In hierdie voorbeeld is die aktiveringsfunksie wat in die uitvoerlaag gebruik word, die softmax-funksie. Die softmax-funksie skakel die geweegde som van insette om in 'n waarskynlikheidsverdeling oor die klasse, waar die som van die waarskynlikhede gelyk is aan 1. Die eenheid met die hoogste waarskynlikheid verteenwoordig die voorspelde klas van die insetbeeld.
Om op te som, die neurale netwerkargitektuur wat in die voorbeeld gebruik word, bestaan uit 'n invoerlaag met 784 eenhede, 'n versteekte laag met 128 eenhede wat die ReLU-aktiveringsfunksie gebruik, en 'n uitsetlaag met 10 eenhede wat die softmax-aktiveringsfunksie gebruik.
Ander onlangse vrae en antwoorde t.o.v Die bou van 'n neurale netwerk om klassifikasie uit te voer:
- Is dit nodig om 'n asynchrone leerfunksie te gebruik vir masjienleermodelle wat in TensorFlow.js loop?
- Hoe word die model saamgestel en opgelei in TensorFlow.js, en wat is die rol van die kategoriese kruisentropieverliesfunksie?
- Wat is die betekenis van die leertempo en aantal tydperke in die masjienleerproses?
- Hoe word die opleidingsdata in opleiding- en toetsstelle in TensorFlow.js verdeel?
- Wat is die doel van TensorFlow.js om 'n neurale netwerk vir klassifikasietake te bou?