80 % svorio skyrimas mokymui ir 20 % vertinimui mašininio mokymosi kontekste yra strateginis sprendimas, pagrįstas keliais veiksniais. Šiuo paskirstymu siekiama išlaikyti pusiausvyrą tarp mokymosi proceso optimizavimo ir tikslaus modelio veikimo įvertinimo. Šiame atsakyme mes gilinsimės į šio pasirinkimo priežastis ir išnagrinėsime jo teikiamą didaktinę vertę.
Norint suprasti 80 % mokymo ir 20 % vertinimo padalijimo priežastis, labai svarbu suprasti septynis mašininio mokymosi žingsnius. Šie veiksmai, apimantys duomenų rinkimą, duomenų paruošimą, modelio mokymą, modelio vertinimą, modelio derinimą, modelio diegimą ir modelio stebėjimą, sudaro išsamią mašininio mokymosi modelių kūrimo sistemą.
Pradinis žingsnis, duomenų rinkimas, apima atitinkamų duomenų rinkimą modeliui išmokyti. Tada šie duomenys iš anksto apdorojami ir paruošiami duomenų rengimo etape. Kai duomenys bus paruošti, prasideda modelio mokymo etapas, kai modelis yra veikiamas mokymo duomenų rinkinio, kad būtų išmokti modeliai ir santykiai. Tada modelio našumas įvertinamas naudojant atskirą duomenų rinkinį modelio vertinimo etape.
Sprendimas 80 % svorio skirti treniruotėms ir 20 % vertinimui kyla dėl to, kad mokymas yra pagrindinė fazė, kai modelis mokosi iš duomenų. Treniruotės metu modelis koreguoja savo vidinius parametrus, kad sumažintų skirtumą tarp numatomų ir faktinių išėjimų mokymo duomenų rinkinyje. Šis procesas apima kartotinį modelio parametrų atnaujinimą naudojant optimizavimo algoritmus, tokius kaip gradiento nusileidimas.
Treniruotėms priskirdami didesnį svorį, pirmenybę teikiame modelio gebėjimui mokytis iš duomenų ir užfiksuoti sudėtingus modelius. Mokymo fazė yra ta, kai modelis įgyja žinių ir apibendrina mokymo duomenų rinkinį, kad galėtų numatyti nematomus duomenis. Kuo daugiau modelio mokymo duomenų, tuo geriau jis gali mokytis ir apibendrinti. Todėl, skiriant didelę vertinimo proceso dalį mokymui, užtikrinama, kad modelis turi pakankamai mokymo duomenų, kad būtų galima efektyviai mokytis.
Kita vertus, vertinimo fazė vaidina lemiamą vaidmenį vertinant modelio veikimą pagal nematomus duomenis. Vertinimo duomenų rinkinys, kuris yra atskiras nuo mokymo duomenų rinkinio, yra realaus pasaulio scenarijų tarpinis serveris. Tai leidžia mums įvertinti, kaip gerai modelis gali apibendrinti savo mokymąsi naujais ir nematytais atvejais. Modelio našumo įvertinimas yra būtinas norint išmatuoti jo tikslumą, tikslumą, atšaukimą ar bet kokią kitą svarbią metriką, atsižvelgiant į konkrečią problemos sritį.
Įvertinimui suteiktas 20 % svoris užtikrina, kad modelis būtų griežtai išbandytas naudojant nematomus duomenis ir realiai įvertinamos jo galimybės. Šis vertinimo etapas padeda atskleisti bet kokias galimas problemas, tokias kaip per didelis pritaikymas, netinkamas pritaikymas arba modelio prognozių šališkumas. Tai taip pat leidžia tiksliai sureguliuoti hiperparametrus ir modelio architektūrą, kad būtų pagerintas našumas.
Norėdami iliustruoti šią koncepciją, panagrinėkime praktinį pavyzdį. Tarkime, kad mokome mašininio mokymosi modelį, kad galėtume klasifikuoti kačių ir šunų vaizdus. Treniruotės metu modelis išmoksta atskirti kačių ir šunų ypatybes, analizuodamas didelį paženklintų vaizdų duomenų rinkinį. Kuo daugiau vaizdų modelis gali treniruotis, tuo geriau jis atskiria dvi klases.
Pasibaigus mokymui, modelis įvertinamas naudojant atskirą duomenų rinkinį, kuriame yra vaizdai, kurių jis dar niekada nematė. Šis vertinimo etapas patikrina modelio gebėjimą apibendrinti mokymąsi ir tiksliai klasifikuoti naujus, nematytus vaizdus. Įvertinimui skirdami 20 % svorio, užtikriname, kad modelio veikimas būtų nuodugniai įvertintas remiantis nematomais duomenimis, taip užtikrinant patikimą jo efektyvumo matą.
80 % svorio paskirstymas mokymui ir 20 % įvertinimas mašininio mokymosi srityje yra strateginis pasirinkimas, kuriuo siekiama optimizuoti mokymosi procesą ir užtikrinti tikslų modelio veikimo įvertinimą. Didelę vertinimo proceso dalį skirdami mokymui, pirmenybę teikiame modelio gebėjimui mokytis iš duomenų ir užfiksuoti sudėtingus modelius. Tuo pačiu metu vertinimo fazė griežtai išbando modelį pagal nematytus duomenis, pateikiant realų jo galimybių įvertinimą.
Kiti naujausi klausimai ir atsakymai apie EITC/AI/GCML „Google Cloud Machine Learning“:
- Kas yra tekstas į kalbą (TTS) ir kaip jis veikia su AI?
- Kokie yra apribojimai dirbant su dideliais duomenų rinkiniais mašininio mokymosi metu?
- Ar mašininis mokymasis gali padėti dialogui?
- Kas yra TensorFlow žaidimų aikštelė?
- Ką iš tikrųjų reiškia didesnis duomenų rinkinys?
- Kokie yra algoritmo hiperparametrų pavyzdžiai?
- Kas yra ansamblinis mokymasis?
- Ką daryti, jei pasirinktas mašininio mokymosi algoritmas netinka ir kaip įsitikinti, kad pasirinksite tinkamą?
- Ar mašininio mokymosi modelį reikia prižiūrėti jo mokymo metu?
- Kokie pagrindiniai parametrai naudojami neuroniniais tinklais pagrįstuose algoritmuose?
Peržiūrėkite daugiau klausimų ir atsakymų EITC/AI/GCML Google Cloud Machine Learning