Convolutional neurale netwerke (CNN's) is eers ontwerp vir die doel van beeldherkenning in die veld van rekenaarvisie. Hierdie netwerke is 'n gespesialiseerde tipe kunsmatige neurale netwerk wat bewys het dat dit hoogs effektief is in die ontleding van visuele data. Die ontwikkeling van CNN's is gedryf deur die behoefte om modelle te skep wat beelde akkuraat kan klassifiseer en kategoriseer, en hul sukses in hierdie domein het gelei tot die wydverspreide gebruik daarvan in verskeie ander toepassings soos objekbespeuring, beeldsegmentering en selfs natuurlike taalverwerking.
CNN's is geïnspireer deur die struktuur en funksionaliteit van die visuele korteks in die menslike brein. Soos die visuele korteks, bestaan CNN's uit veelvuldige lae van onderling gekoppelde neurone wat verskillende aspekte van die insetdata verwerk. Die sleutelinnovasie van CNN's lê in hul vermoë om outomaties relevante kenmerke uit beelde te leer en te onttrek, wat die behoefte aan handmatige kenmerk-ingenieurswese uitskakel. Dit word bereik deur die gebruik van konvolusionele lae, wat filters op die invoerbeeld toepas om verskeie visuele patrone en kenmerke, soos rande, hoeke en teksture, op te spoor.
Die eerste deurbraak in CNN's het gekom met die bekendstelling van die LeNet-5-argitektuur deur Yann LeCun et al. in 1998. LeNet-5 is spesifiek ontwerp vir handgeskrewe syferherkenning en het merkwaardige prestasie op die MNIST-datastel behaal, 'n maatstafdatastel wat wyd gebruik word vir die evaluering van beeldherkenningsalgoritmes. LeNet-5 het die krag van CNN's gedemonstreer om hiërargiese kenmerke van beelde vas te lê, wat akkurate klassifikasie moontlik maak selfs in die teenwoordigheid van variasies in skaal, rotasie en translasie.
Sedertdien het CNN's aansienlik ontwikkel, met dieper en meer komplekse argitekture wat ontwikkel is. Een noemenswaardige vooruitgang was die bekendstelling van die AlexNet-argitektuur deur Alex Krizhevsky et al. in 2012. AlexNet het 'n deurbraak in beeldklassifikasie behaal deur die ImageNet Large Scale Visual Recognition Challenge (ILSVRC) te wen met 'n aansienlik laer foutkoers in vergelyking met vorige benaderings. Hierdie sukses het die weg gebaan vir die wydverspreide aanvaarding van CNN's in beeldherkenningstake.
CNN's is ook suksesvol toegepas op ander rekenaarvisie-take. Byvoorbeeld, in voorwerpopsporing, kan CNN'e gekombineer word met bykomende lae om voorwerpe binne 'n beeld te lokaliseer en te klassifiseer. Die bekende Streek-gebaseerde Convolutional Neural Network (R-CNN) wat deur Ross Girshick et al. in 2014 is 'n voorbeeld van so 'n argitektuur. R-CNN het die nuutste resultate behaal oor objekbespeuringsmaatstawwe deur die krag van CNN's te benut vir kenmerkonttrekking en dit te kombineer met streekvoorstelmetodes.
Konvolusionele neurale netwerke is eers ontwerp vir beeldherkenningstake in die veld van rekenaarvisie. Hulle het 'n rewolusie in die veld gemaak deur outomaties relevante kenmerke van beelde te leer, wat die behoefte aan handmatige kenmerk-ingenieurswese uitskakel. Die ontwikkeling van CNN's het gelei tot aansienlike vordering in beeldklassifikasie, objekbespeuring en verskeie ander rekenaarvisietake.
Ander onlangse vrae en antwoorde t.o.v EITC/AI/ADL Gevorderde diep leer:
- Waarom moet ons optimalisering in masjienleer toepas?
- Wanneer vind oorfitting plaas?
- Kan Convolutional Neurale Networks opeenvolgende data hanteer deur konvolusies oor tyd in te sluit, soos gebruik in Convolutional Sequence to Sequence modelle?
- Maak Generative Adversarial Networks (GAN's) staat op die idee van 'n generator en 'n diskrimineerder?