Waarom is die evaluering 80% vir opleiding en 20% vir evaluering, maar nie die teenoorgestelde nie?

by Nguyen Xuan Tung / Donderdag 17 Augustus 2023 / gepubliseer in Kunsmatige Intelligensie, EITC/AI/GCML Google Cloud Machine Learning, Eerste stappe in masjienleer, Die 7 stappe van masjienleer

Die toekenning van 80% gewig aan opleiding en 20% gewig aan evaluering in die konteks van masjienleer is 'n strategiese besluit gebaseer op verskeie faktore. Hierdie verspreiding het ten doel om 'n balans te vind tussen die optimalisering van die leerproses en die versekering van akkurate evaluering van die model se prestasie. In hierdie antwoord sal ons in die redes agter hierdie keuse delf en die didaktiese waarde wat dit bied, ondersoek.

Om die rasionaal agter die 80% opleiding en 20% evalueringsverdeling te begryp, is dit noodsaaklik om die sewe stappe van masjienleer te verstaan. Hierdie stappe, wat data-insameling, datavoorbereiding, modelopleiding, model-evaluering, modelinstelling, modelontplooiing en modelmonitering insluit, vorm 'n omvattende raamwerk vir die bou van masjienleermodelle.

Die aanvanklike stap, data-insameling, behels die insameling van relevante data om die model op te lei. Hierdie data word dan vooraf verwerk en voorberei in die datavoorbereidingsfase. Sodra die data gereed is, begin die modelopleidingsfase, waar die model aan die opleidingdatastel blootgestel word om patrone en verhoudings te leer. Die model se prestasie word dan geëvalueer deur gebruik te maak van 'n aparte datastel in die model-evalueringsfase.

Die besluit om 80% gewig aan opleiding toe te ken en 20% gewig aan evaluering spruit uit die feit dat opleiding die primêre fase is waar die model uit die data leer. Tydens opleiding pas die model sy interne parameters aan om die verskil tussen sy voorspelde uitsette en die werklike uitsette in die opleidingdatastel te minimaliseer. Hierdie proses behels die iteratiewe opdatering van die model se parameters deur gebruik te maak van optimaliseringsalgoritmes soos gradiënt afkoms.

Deur 'n hoër gewig aan opleiding toe te ken, prioritiseer ons die model se vermoë om uit die data te leer en komplekse patrone vas te lê. Die opleidingsfase is waar die model sy kennis opdoen en veralgemeen vanaf die opleidingsdatastel om voorspellings oor onsigbare data te maak. Hoe meer opleidingsdata waaraan die model blootgestel word, hoe beter kan dit leer en veralgemeen. Om dus 'n beduidende gedeelte van die evalueringsproses aan opleiding te wy, verseker dat die model voldoende blootstelling aan die opleidingsdata het vir effektiewe leer.

Aan die ander kant speel die evalueringsfase 'n deurslaggewende rol in die beoordeling van die model se prestasie op onsigbare data. Die evalueringsdatastel, wat apart van die opleidingdatastel is, dien as 'n instaanbediener vir werklike scenario's. Dit stel ons in staat om te bepaal hoe goed die model sy leer kan veralgemeen na nuwe en onsigbare gevalle. Die evaluering van die model se prestasie is noodsaaklik om die akkuraatheid, akkuraatheid, herroeping of enige ander relevante maatstawwe daarvan te meet, afhangende van die spesifieke probleemdomein.

Die gewig van 20% wat aan evaluering gegee word, verseker dat die model streng op onsigbare data getoets word en bied 'n realistiese beoordeling van sy vermoëns. Hierdie evalueringsfase help om enige potensiële kwessies soos oorpas, onderaanpassing of vooroordeel in die model se voorspellings te ontbloot. Dit maak ook die fyninstelling van hiperparameters en modelargitektuur moontlik om werkverrigting te verbeter.

Om hierdie konsep te illustreer, kom ons kyk na 'n praktiese voorbeeld. Gestel ons oefen 'n masjienleermodel op om beelde van katte en honde te klassifiseer. Tydens die opleidingsfase leer die model om te onderskei tussen die kenmerke van katte en honde deur 'n groot datastel van benoemde beelde te ontleed. Hoe meer beelde die model kan oefen, hoe beter word dit om tussen die twee klasse te onderskei.

Sodra die opleiding voltooi is, word die model geëvalueer deur 'n aparte datastel te gebruik wat beelde bevat wat dit nog nooit voorheen gesien het nie. Hierdie evalueringsfase toets die model se vermoë om sy leer te veralgemeen en nuwe, onsigbare beelde akkuraat te klassifiseer. Deur 20% gewig aan evaluering toe te ken, verseker ons dat die model se prestasie deeglik beoordeel word op onsigbare data, wat 'n betroubare maatstaf van die doeltreffendheid daarvan verskaf.

Die verdeling van 80% gewig na opleiding en 20% gewig na evaluering in masjienleer is 'n strategiese keuse wat daarop gemik is om die leerproses te optimaliseer terwyl dit akkurate assessering van die model se prestasie verseker. Deur 'n beduidende deel van die evalueringsproses aan opleiding te wy, prioritiseer ons die model se vermoë om uit die data te leer en komplekse patrone vas te lê. Terselfdertyd toets die evalueringsfase die model streng op onsigbare data, wat 'n realistiese beoordeling van sy vermoëns verskaf.

Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:

Bekyk meer vrae en antwoorde in EITC/AI/GCML Google Cloud Machine Learning

Meer vrae en antwoorde:

gebied: Kunsmatige Intelligensie
program: EITC/AI/GCML Google Cloud Machine Learning (gaan na die sertifiseringsprogram)
les: Eerste stappe in masjienleer (gaan na verwante les)
Onderwerp: Die 7 stappe van masjienleer (gaan na verwante onderwerp)

Gemerk onder: Kunsmatige Intelligensie, Data Voorbereiding, masjienleer, Model Evaluering, Model Opleiding, Optimalisering algoritmes

EITCA Akademie

Waarom is die evaluering 80% vir opleiding en 20% vir evaluering, maar nie die teenoorgestelde nie?

Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:

Meer vrae en antwoorde:

EITCA Akademie is deel van die Europese IT-sertifiseringsraamwerk

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie support

EITCA Akademie

Teken in op u rekening deur u gebruikersnaam of e-posadres

VERGELY JOU BESONDERHEDE?

MAAK 'N REKENING OOP

Waarom is die evaluering 80% vir opleiding en 20% vir evaluering, maar nie die teenoorgestelde nie?

Ander onlangse vrae en antwoorde t.o.v EITC/AI/GCML Google Cloud Machine Learning:

Meer vrae en antwoorde:

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie ​​support

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie support