Prižiūrimas, neprižiūrimas ir sustiprintas mokymasis yra trys skirtingi metodai mašininio mokymosi srityje. Kiekvienas metodas naudoja skirtingus metodus ir algoritmus, kad išspręstų įvairių tipų problemas ir pasiektų konkrečius tikslus. Išnagrinėkime šių metodų skirtumus ir pateiksime išsamų jų savybių ir taikymo paaiškinimą.
Prižiūrimas mokymasis yra mašininio mokymosi tipas, kai algoritmas mokosi iš pažymėtų duomenų. Pažymėti duomenys susideda iš įvesties pavyzdžių, suporuotų su atitinkama teisinga išvesties arba tiksline verte. Prižiūrimo mokymosi tikslas – parengti modelį, galintį tiksliai numatyti naujų, nematytų įvesties išvestį. Mokymosi algoritmas naudoja pažymėtus duomenis, kad nustatytų modelius ir ryšius tarp įvesties funkcijų ir išvesties etikečių. Tada jis apibendrina šias žinias, kad galėtų numatyti naujus, nepažymėtus duomenis. Prižiūrimas mokymasis dažniausiai naudojamas atliekant tokias užduotis kaip klasifikavimas ir regresija.
Pavyzdžiui, sprendžiant klasifikavimo problemą, algoritmas mokomas duomenų rinkinyje, kuriame kiekvienas duomenų taškas yra pažymėtas tam tikra klase. Algoritmas išmoksta klasifikuoti naujus, nematytus duomenų taškus į vieną iš iš anksto nustatytų klasių pagal šablonus, kuriuos išmoko iš pažymėtų pavyzdžių. Regresijos uždavinyje algoritmas išmoksta numatyti ištisinę skaitinę reikšmę pagal įvesties ypatybes.
Kita vertus, neprižiūrimas mokymasis susijęs su nepažymėtais duomenimis. Neprižiūrimo mokymosi tikslas yra atrasti paslėptus modelius, struktūras ar ryšius tarp duomenų be jokių išankstinių žinių apie išvesties etiketes. Skirtingai nuo prižiūrimo mokymosi, neprižiūrimo mokymosi algoritmai neturi aiškių tikslinių verčių, pagal kurias būtų vadovaujamasi mokymosi procesui. Vietoj to jie sutelkia dėmesį į prasmingų duomenų ar grupių radimą. Neprižiūrimas mokymasis dažniausiai naudojamas atliekant tokias užduotis kaip grupavimas, matmenų mažinimas ir anomalijų aptikimas.
Klasterizavimas yra populiari neprižiūrimo mokymosi programa, kai algoritmas sugrupuoja panašius duomenų taškus pagal jų būdingas savybes. Pavyzdžiui, segmentuojant klientus, neprižiūrimas mokymosi algoritmas gali būti naudojamas atskiroms klientų grupėms nustatyti pagal jų pirkimo elgseną arba demografinę informaciją.
Sustiprinimo mokymasis yra kitokia paradigma, kai agentas mokosi sąveikauti su aplinka, kad maksimaliai padidintų kaupiamąjį atlygio signalą. Sustiprinimo mokymosi metu algoritmas mokosi per bandymų ir klaidų procesą, imdamasis veiksmų, stebėdamas aplinkos būklę ir gaudamas grįžtamąjį ryšį atlygio ar nuobaudų forma. Tikslas yra rasti optimalią politiką arba veiksmų rinkinį, kuris maksimaliai padidintų ilgalaikį atlygį. Sustiprinimo mokymasis dažniausiai naudojamas atliekant tokias užduotis kaip žaidimai, robotika ir autonominės sistemos.
Pavyzdžiui, šachmatų žaidime sustiprinimo mokymosi agentas gali išmokti žaisti tyrinėdamas įvairius ėjimus, gaudamas apdovanojimus ar nuobaudas pagal kiekvieno ėjimo rezultatą ir koreguodamas savo strategiją, kad padidintų tikimybę laimėti.
Prižiūrimas mokymasis naudoja pažymėtus duomenis, kad parengtų numatymo užduočių modelį, neprižiūrimas mokymasis atranda modelius ir struktūras nepažymėtuose duomenyse, o sustiprinamas mokymasis mokosi sąveikaudamas su aplinka, kad būtų padidintas atlygio signalas. Kiekvienas metodas turi savo stipriąsias ir silpnąsias puses ir yra tinkamas įvairių tipų problemoms ir pritaikymams.
Kiti naujausi klausimai ir atsakymai apie EITC/AI/GCML „Google Cloud Machine Learning“:
- Kas yra tekstas į kalbą (TTS) ir kaip jis veikia su AI?
- Kokie yra apribojimai dirbant su dideliais duomenų rinkiniais mašininio mokymosi metu?
- Ar mašininis mokymasis gali padėti dialogui?
- Kas yra TensorFlow žaidimų aikštelė?
- Ką iš tikrųjų reiškia didesnis duomenų rinkinys?
- Kokie yra algoritmo hiperparametrų pavyzdžiai?
- Kas yra ansamblinis mokymasis?
- Ką daryti, jei pasirinktas mašininio mokymosi algoritmas netinka ir kaip įsitikinti, kad pasirinksite tinkamą?
- Ar mašininio mokymosi modelį reikia prižiūrėti jo mokymo metu?
- Kokie pagrindiniai parametrai naudojami neuroniniais tinklais pagrįstuose algoritmuose?
Peržiūrėkite daugiau klausimų ir atsakymų EITC/AI/GCML Google Cloud Machine Learning