Dirbtinio intelekto (DI) kontekste ir konkrečiai „Google Cloud Machine Learning“ srityje pažymėti duomenys reiškia duomenų rinkinį, kuris buvo komentuotas arba pažymėtas konkrečiomis etiketėmis arba kategorijomis. Šios etiketės yra pagrindinė tiesa arba nuoroda mokant mašininio mokymosi algoritmus. Susiejus duomenų taškus su atitinkamomis etiketėmis, mašininio mokymosi modelis gali išmokti atpažinti modelius ir daryti prognozes, pagrįstus naujais, nematytais duomenimis.
Ženklinti duomenys atlieka labai svarbų vaidmenį prižiūrint mokymąsi, kuris yra įprastas mašininio mokymosi metodas. Atliekant prižiūrimą mokymąsi, modelis mokomas naudojant pažymėtą duomenų rinkinį, kad sužinotų ryšį tarp įvesties funkcijų ir atitinkamų išvesties etikečių. Šis mokymo procesas leidžia modeliui apibendrinti savo žinias ir tiksliai prognozuoti naujus, nematytus duomenis.
Norėdami iliustruoti šią koncepciją, panagrinėkime mašininio mokymosi užduoties vaizdų atpažinimo srityje pavyzdį. Tarkime, kad norime sukurti modelį, kuris galėtų suskirstyti gyvūnų atvaizdus į skirtingas kategorijas, pvz., kates, šunis ir paukščius. Mums reikės pažymėto duomenų rinkinio, kuriame kiekvienas vaizdas būtų susietas su teisinga etikete. Pavyzdžiui, katės atvaizdas būtų pažymėtas kaip „katė“, šuns atvaizdas – „šuo“ ir pan.
Pažymėtas duomenų rinkinys sudarytas iš vaizdų rinkinio ir juos atitinkančių etikečių. Kiekvienas vaizdas būtų pavaizduotas funkcijų rinkiniu, pvz., pikselių reikšmėmis arba aukštesnio lygio atvaizdais, išskirtais iš vaizdo. Etiketėse būtų nurodyta teisinga kategorija ar klasė, kuriai priklauso kiekvienas vaizdas.
Mokymo etape mašininio mokymosi modelis būtų pateiktas su pažymėtu duomenų rinkiniu. Jis išmoktų nustatyti modelius ir ryšius tarp įvesties funkcijų ir atitinkamų etikečių. Modelis atnaujins savo vidinius parametrus, kad sumažintų skirtumą tarp prognozių ir tikrųjų mokymo duomenų etikečių.
Kai modelis yra išmokytas, jis gali būti naudojamas naujų, nematytų vaizdų prognozėms. Atsižvelgdamas į nepažymėtą vaizdą, modelis analizuotų jo ypatybes ir numatytų labiausiai tikėtiną etiketę, remiantis gautomis žiniomis iš pažymėto duomenų rinkinio. Pavyzdžiui, jei modelis numato, kad paveikslėlyje yra katė, tai reiškia, kad jis atpažino vaizde raštus, kurie rodo katę.
Ženklinti duomenys yra pagrindinė mokymo mašininio mokymosi modelių sudedamoji dalis. Jame pateikiama reikalinga informacija, kad modelis galėtų mokytis ir tiksliai prognozuoti. Susiedamas duomenų taškus su atitinkamomis etiketėmis, modelis gali išmokti atpažinti modelius ir apibendrinti savo žinias iki nematomų duomenų.
Kiti naujausi klausimai ir atsakymai apie EITC/AI/GCML „Google Cloud Machine Learning“:
- Kas yra tekstas į kalbą (TTS) ir kaip jis veikia su AI?
- Kokie yra apribojimai dirbant su dideliais duomenų rinkiniais mašininio mokymosi metu?
- Ar mašininis mokymasis gali padėti dialogui?
- Kas yra TensorFlow žaidimų aikštelė?
- Ką iš tikrųjų reiškia didesnis duomenų rinkinys?
- Kokie yra algoritmo hiperparametrų pavyzdžiai?
- Kas yra ansamblinis mokymasis?
- Ką daryti, jei pasirinktas mašininio mokymosi algoritmas netinka ir kaip įsitikinti, kad pasirinksite tinkamą?
- Ar mašininio mokymosi modelį reikia prižiūrėti jo mokymo metu?
- Kokie pagrindiniai parametrai naudojami neuroniniais tinklais pagrįstuose algoritmuose?
Peržiūrėkite daugiau klausimų ir atsakymų EITC/AI/GCML Google Cloud Machine Learning