Funkcijų išskyrimas yra esminis konvoliucinio neuroninio tinklo (CNN) proceso, taikomo vaizdo atpažinimo užduotims, žingsnis. CNN funkcijų išgavimo procesas apima reikšmingų funkcijų ištraukimą iš įvesties vaizdų, kad būtų lengviau klasifikuoti. Šis procesas yra būtinas, nes neapdorotos vaizdo taškų reikšmės nėra tiesiogiai tinkamos klasifikavimo užduotims atlikti. Išskirdami atitinkamas funkcijas, CNN gali išmokti atpažinti vaizdų modelius ir formas, kad galėtų atskirti skirtingas objektų ar objektų klases.
Funkcijų išgavimo procesas CNN paprastai apima konvoliucinių sluoksnių naudojimą. Šie sluoksniai įvesties vaizdui taiko filtrus, taip pat žinomus kaip branduoliai. Kiekvienas filtras nuskaito įvesties vaizdą, atlikdamas daugybos ir sumavimo operacijas pagal elementus, kad sudarytų funkcijų žemėlapį. Funkcijų žemėlapiai fiksuoja konkrečius įvesties vaizde esančius raštus arba ypatybes, pvz., kraštus, tekstūras ar formas. Kelių filtrų naudojimas konvoliuciniuose sluoksniuose leidžia CNN išgauti įvairius funkcijų rinkinius skirtingose erdvinėse hierarchijose.
Po konvoliucinių sluoksnių CNN dažnai apima aktyvinimo funkcijas, tokias kaip ReLU (Rektified Linear Unit), kad į modelį būtų įtrauktas netiesiškumas. Netiesinės aktyvinimo funkcijos yra labai svarbios, kad CNN galėtų išmokti sudėtingų duomenų ryšių ir modelių. Tada paprastai taikomi telkimo sluoksniai, pvz., maksimalus telkimas arba vidutinis telkimas, siekiant sumažinti objektų žemėlapių erdvinius matmenis, išsaugant svarbiausią informaciją. Sujungimas padeda padaryti tinklą atsparesnį įvesties vaizdų variacijoms ir sumažina skaičiavimo sudėtingumą.
Po konvoliucinio ir telkinio sluoksnių išgauti elementai suplokštinami į vektorių ir praeina per vieną ar daugiau visiškai sujungtų sluoksnių. Šie sluoksniai tarnauja kaip klasifikatoriai, mokantys susieti išgautas ypatybes į atitinkamas išvesties klases. Galutinis visiškai prijungtas sluoksnis paprastai naudoja „softmax“ aktyvinimo funkciją, kad sugeneruotų klasių tikimybes kelių klasių klasifikavimo užduotims.
Norėdami iliustruoti vaizdų atpažinimo CNN funkcijų ištraukimo procesą, apsvarstykite drabužių vaizdų klasifikavimo pavyzdį. Pagal šį scenarijų CNN išmoktų išskirti tokias savybes kaip tekstūros, spalvos ir raštai, būdingi įvairių tipų drabužiams, pavyzdžiui, batams, marškiniams ar kelnėms. Apdorodama didelį paženklintų drabužių vaizdų duomenų rinkinį, CNN nuolat koreguotų savo filtrus ir svorius, kad tiksliai nustatytų ir klasifikuotų šias išskirtines savybes, o tai galiausiai leistų labai tiksliai prognozuoti nematomus vaizdus.
Funkcijų išskyrimas yra pagrindinė CNN vaizdų atpažinimo sudedamoji dalis, leidžianti modeliui išmokti ir atskirti atitinkamus šablonus ir įvesties vaizdų funkcijas. Naudodami konvoliucinius sluoksnius, aktyvinimo funkcijas, telkimo sluoksnius ir visiškai sujungtus sluoksnius, CNN gali efektyviai išgauti ir panaudoti reikšmingas funkcijas, kad galėtų atlikti tikslias klasifikavimo užduotis.
Kiti naujausi klausimai ir atsakymai apie EITC/AI/TFF „TensorFlow“ pagrindai:
- Kaip galima naudoti įterpimo sluoksnį, kad automatiškai priskirtų tinkamas ašis žodžių, kaip vektorių, vaizdavimo diagramai?
- Koks yra maksimalaus telkimo tikslas CNN?
- Ar TensorFlow.js veikiantiems mašininio mokymosi modeliams būtina naudoti asinchroninio mokymosi funkciją?
- Koks yra TensorFlow Keras Tokenizer API maksimalaus žodžių skaičiaus parametras?
- Ar TensorFlow Keras Tokenizer API galima naudoti ieškant dažniausiai pasitaikančių žodžių?
- Kas yra TOCO?
- Koks ryšys tarp kelių mašininio mokymosi modelio epochų ir modelio veikimo prognozės tikslumo?
- Ar „TensorFlow Neural Structured Learning“ paketo kaimynų API sukuria papildytą mokymo duomenų rinkinį, pagrįstą natūraliais grafiko duomenimis?
- Kas yra „TensorFlow Neural Structured Learning“ paketo kaimynų API?
- Ar neuroninis struktūrinis mokymasis gali būti naudojamas su duomenimis, kuriems nėra natūralaus grafiko?
Peržiūrėkite daugiau klausimų ir atsakymų EITC/AI/TFF TensorFlow Fundamentals