Wat is 'n gemerkte data?

by Jean-Christian OMYALE / Donderdag, 25 Januarie 2024 / gepubliseer in Kunsmatige Intelligensie, EITC/AI/GCML Google Cloud Machine Learning, Inleiding, Wat is masjienleer

'n Gemerkte data, in die konteks van Kunsmatige Intelligensie (KI) en spesifiek in die domein van Google Wolk-masjienleer, verwys na 'n datastel wat met spesifieke etikette of kategorieë geannoteer of gemerk is. Hierdie etikette dien as die grondwaarheid of verwysing vir die opleiding van masjienleeralgoritmes. Deur datapunte met hul ooreenstemmende etikette te assosieer, kan die masjienleermodel leer om patrone te herken en voorspellings te maak gebaseer op nuwe, onsigbare data.

Gemerkte data speel 'n deurslaggewende rol in leer onder toesig, wat 'n algemene benadering in masjienleer is. In leer onder toesig word die model op 'n benoemde datastel opgelei om die verband tussen insetkenmerke en hul ooreenstemmende uitsetetikette te leer. Hierdie opleidingsproses laat die model toe om sy kennis te veralgemeen en akkurate voorspellings te maak oor nuwe, onsigbare data.

Om hierdie konsep te illustreer, kom ons kyk na 'n voorbeeld van 'n masjienleertaak in die veld van beeldherkenning. Gestel ons wil 'n model bou wat beelde van diere in verskillende kategorieë kan klassifiseer soos katte, honde en voëls. Ons sal 'n benoemde datastel nodig hê waar elke prent met sy korrekte etiket geassosieer word. Byvoorbeeld, 'n beeld van 'n kat sal gemerk word as "kat", 'n beeld van 'n hond as "hond," ensovoorts.

Die benoemde datastel sal uit 'n versameling beelde en hul ooreenstemmende etikette bestaan. Elke prent sal deur 'n stel kenmerke voorgestel word, soos pixelwaardes of hoërvlakvoorstellings wat uit die prent onttrek word. Die etikette sal die korrekte kategorie of klas aandui waartoe elke prent behoort.

Tydens die opleidingsfase sal die masjienleermodel met die benoemde datastel aangebied word. Dit sal leer om patrone en verwantskappe tussen die insetkenmerke en die ooreenstemmende byskrifte te identifiseer. Die model sal sy interne parameters bywerk om die verskil tussen sy voorspellings en die ware etikette in die opleidingsdata te minimaliseer.

Sodra die model opgelei is, kan dit gebruik word om voorspellings op nuwe, onsigbare beelde te maak. Gegewe 'n ongemerkte beeld, sal die model sy kenmerke ontleed en die mees waarskynlike etiket voorspel gebaseer op sy geleerde kennis van die benoemde datastel. Byvoorbeeld, as die model voorspel dat 'n beeld 'n kat bevat, beteken dit dat dit patrone in die beeld het wat 'n kat aandui.

Gemerkte data is 'n fundamentele komponent in die opleiding van masjienleermodelle. Dit verskaf die nodige inligting vir die model om van te leer en akkurate voorspellings te maak. Deur datapunte met hul ooreenstemmende etikette te assosieer, kan die model leer om patrone te herken en sy kennis na ongesiene data te veralgemeen.

Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:

Bekyk meer vrae en antwoorde in EITC/AI/GCML Google Cloud Machine Learning

Meer vrae en antwoorde:

gebied: Kunsmatige Intelligensie
program: EITC/AI/GCML Google Cloud Machine Learning (gaan na die sertifiseringsprogram)
les: Inleiding (gaan na verwante les)
Onderwerp: Wat is masjienleer (gaan na verwante onderwerp)

Gemerk onder: Kunsmatige Intelligensie, Google Wolkmasjienleer, Beeldherkenning, Gemerkte data, masjienleer, Toesig oor leer

EITCA Akademie

Wat is 'n gemerkte data?

Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:

Meer vrae en antwoorde:

EITCA Akademie is deel van die Europese IT-sertifiseringsraamwerk

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie support

EITCA Akademie

Teken in op u rekening deur u gebruikersnaam of e-posadres

VERGELY JOU BESONDERHEDE?

MAAK 'N REKENING OOP

Wat is 'n gemerkte data?

Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:

Meer vrae en antwoorde:

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie ​​support

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie support