Die Fashion-MNIST-datastel en die klassieke MNIST-datastel is twee gewilde datastelle wat gebruik word in die veld van masjienleer vir beeldklassifikasietake. Alhoewel beide datastelle uit grysskaalbeelde bestaan en algemeen gebruik word vir benchmarking en evaluering van masjienleeralgoritmes, is daar verskeie sleutelverskille tussen hulle.
Eerstens bevat die klassieke MNIST-datastel beelde van handgeskrewe syfers (0-9) geneem uit die NIST Spesiale Databasis 3 en NIST Spesiale Databasis 1. Die beelde in hierdie datastel is 28×28 pixels groot en het 'n enkele kanaal (grysskaal). Die datastel bestaan uit 60,000 10,000 opleidingsbeelde en 70,000 0 toetsbeelde, wat 'n totaal van 9 XNUMX beelde maak. Elke prent is gemerk met die ooreenstemmende syfer wat dit verteenwoordig, wat wissel van XNUMX tot XNUMX.
Aan die ander kant is die Fashion-MNIST-datastel ontwerp om 'n instap-vervanger vir die klassieke MNIST-datastel te wees, maar met 'n fokus op modeprodukte. Dit bestaan uit 60,000 10,000 opleidingsbeelde en 28 28 toetsbeelde, soos die klassieke MNIST-datastel. In plaas van handgeskrewe syfers bevat die Fashion-MNIST-datastel egter beelde van modeprodukte soos klere, skoene en bykomstighede. Hierdie beelde is ook XNUMX×XNUMX pixels groot en het 'n enkele kanaal (grysskaal). Elke prent in die Fashion-MNIST-datastel is gemerk met een van die volgende kategorieë: T-hemp/top, broek, trui, rok, jas, sandaal, hemp, sneaker, sak en enkelstewel.
Die hoofmotivering agter die skepping van die Fashion-MNIST-datastel was om 'n meer uitdagende en realistiese datastel vir beeldklassifikasietake te verskaf. Terwyl die klassieke MNIST-datastel omvattend bestudeer is en baie masjienleeralgoritmes hoë akkuraatheid daarop behaal, word dit dikwels gekritiseer omdat dit te maklik is en nie verteenwoordigend van werklike scenario's nie. Deur die Fashion-MNIST-datastel bekend te stel, het navorsers en praktisyns 'n meer diverse en komplekse datastel om mee te werk, wat hulle in staat stel om algoritmes te ontwikkel en te evalueer wat meer robuust en toepaslik is op werklike probleme.
Wat toepassing betref, word die klassieke MNIST-datastel dikwels gebruik as 'n beginpunt vir beginners in die veld van masjienleer. Die eenvoud en klein grootte daarvan maak dit ideaal om die basiese beginsels van beeldklassifikasiealgoritmes te leer en hul werkverrigting te evalueer. Aan die ander kant is die Fashion-MNIST-datastel geskik vir meer gevorderde take, waar die doel is om modeprodukte akkuraat te klassifiseer. Hierdie datastel kan gebruik word om masjienleermodelle op te lei vir verskeie toepassings, soos mode-aanbevelingstelsels, virtuele probeer-aan en beeldgebaseerde soektog in e-handel.
Die Fashion-MNIST-datastel en die klassieke MNIST-datastel is twee wydgebruikte datastelle in die veld van masjienleer vir beeldklassifikasietake. Terwyl die klassieke MNIST-datastel uit handgeskrewe syfers bestaan, bevat die Fashion-MNIST-datastel beelde van modeprodukte. Die Fashion-MNIST-datastel bied 'n meer uitdagende en realistiese datastel vir die evaluering van masjienleeralgoritmes in die konteks van mode. Beide datastelle het hul eie toepassings en kan gebruik word om masjienleermodelle vir verskeie beeldklassifikasietake op te lei en te evalueer.
Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:
- Wat is die onderskeid tussen toesig-, nie-toesig- en versterkende leerbenaderings?
- Is dit korrek dat aanvanklike datastel in drie hoofsubstelle gespoeg kan word: die opleidingstel, die valideringstel (om parameters te verfyn) en die toetsstel (nagaan prestasie op ongesiene data)?
- Wat is Google Wolkplatform (GCP)?
- Wat is 'n besluitboom?
- Hoe om te weet watter algoritme meer data benodig as die ander?
- Wat is die metodes om datastelle vir masjienleermodel-opleiding in te samel?
- Hoeveel data is nodig vir opleiding?
- Hoe lyk die proses van etikettering van data en wie voer dit uit?
- Wat presies is die uitsetetikette, teikenwaardes en eienskappe?
- Moet kenmerke wat data verteenwoordig in 'n numeriese formaat wees en in kenmerkkolomme georganiseer word?
Bekyk meer vrae en antwoorde in EITC/AI/GCML Google Cloud Machine Learning