'n Gemerkte data, in die konteks van Kunsmatige Intelligensie (KI) en spesifiek in die domein van Google Wolk-masjienleer, verwys na 'n datastel wat met spesifieke etikette of kategorieë geannoteer of gemerk is. Hierdie etikette dien as die grondwaarheid of verwysing vir die opleiding van masjienleeralgoritmes. Deur datapunte met hul ooreenstemmende etikette te assosieer, kan die masjienleermodel leer om patrone te herken en voorspellings te maak gebaseer op nuwe, onsigbare data.
Gemerkte data speel 'n deurslaggewende rol in leer onder toesig, wat 'n algemene benadering in masjienleer is. In leer onder toesig word die model op 'n benoemde datastel opgelei om die verband tussen insetkenmerke en hul ooreenstemmende uitsetetikette te leer. Hierdie opleidingsproses laat die model toe om sy kennis te veralgemeen en akkurate voorspellings te maak oor nuwe, onsigbare data.
Om hierdie konsep te illustreer, kom ons kyk na 'n voorbeeld van 'n masjienleertaak in die veld van beeldherkenning. Gestel ons wil 'n model bou wat beelde van diere in verskillende kategorieë kan klassifiseer soos katte, honde en voëls. Ons sal 'n benoemde datastel nodig hê waar elke prent met sy korrekte etiket geassosieer word. Byvoorbeeld, 'n beeld van 'n kat sal gemerk word as "kat", 'n beeld van 'n hond as "hond," ensovoorts.
Die benoemde datastel sal uit 'n versameling beelde en hul ooreenstemmende etikette bestaan. Elke prent sal deur 'n stel kenmerke voorgestel word, soos pixelwaardes of hoërvlakvoorstellings wat uit die prent onttrek word. Die etikette sal die korrekte kategorie of klas aandui waartoe elke prent behoort.
Tydens die opleidingsfase sal die masjienleermodel met die benoemde datastel aangebied word. Dit sal leer om patrone en verwantskappe tussen die insetkenmerke en die ooreenstemmende byskrifte te identifiseer. Die model sal sy interne parameters bywerk om die verskil tussen sy voorspellings en die ware etikette in die opleidingsdata te minimaliseer.
Sodra die model opgelei is, kan dit gebruik word om voorspellings op nuwe, onsigbare beelde te maak. Gegewe 'n ongemerkte beeld, sal die model sy kenmerke ontleed en die mees waarskynlike etiket voorspel gebaseer op sy geleerde kennis van die benoemde datastel. Byvoorbeeld, as die model voorspel dat 'n beeld 'n kat bevat, beteken dit dat dit patrone in die beeld het wat 'n kat aandui.
Gemerkte data is 'n fundamentele komponent in die opleiding van masjienleermodelle. Dit verskaf die nodige inligting vir die model om van te leer en akkurate voorspellings te maak. Deur datapunte met hul ooreenstemmende etikette te assosieer, kan die model leer om patrone te herken en sy kennis na ongesiene data te veralgemeen.
Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:
- Wat is teks na spraak (TTS) en hoe dit met KI werk?
- Wat is die beperkings om met groot datastelle in masjienleer te werk?
- Kan masjienleer 'n bietjie dialogiese hulp verleen?
- Wat is die TensorFlow-speelgrond?
- Wat beteken 'n groter datastel eintlik?
- Wat is 'n paar voorbeelde van algoritme se hiperparameters?
- Wat is ensamble learning?
- Wat as 'n gekose masjienleeralgoritme nie geskik is nie en hoe kan 'n mens seker maak om die regte een te kies?
- Benodig 'n masjienleermodel toesig tydens sy opleiding?
- Wat is die sleutelparameters wat in neurale netwerkgebaseerde algoritmes gebruik word?
Bekyk meer vrae en antwoorde in EITC/AI/GCML Google Cloud Machine Learning