Norėdami programiškai išskirti etiketes iš vaizdų naudodami Python ir Vision API, galite pasinaudoti galingomis Google Cloud Vision API galimybėmis. Vision API suteikia išsamų vaizdų analizės funkcijų rinkinį, įskaitant etikečių aptikimą, kuris leidžia automatiškai identifikuoti ir ištraukti etiketes iš vaizdų.
Norėdami pradėti, turėsite nustatyti „Google Cloud“ projektą ir įgalinti „Vision“ API. Kai tai padarysite, galite įdiegti reikiamas Python bibliotekas vykdydami šią komandą:
python pip install google-cloud-vision
Tada turite patvirtinti savo taikomąją programą, kad galėtumėte pasiekti Vision API. Tai galite padaryti sukurdami paslaugos paskyros raktą ir nustatydami aplinkos kintamąjį „GOOGLE_APPLICATION_CREDENTIALS“, kad jis nurodytų rakto failo kelią. Tai galima padaryti naudojant šį kodą:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Dabar galite naudoti Vision API, kad programiškai išskirtumėte etiketes iš vaizdų. Šis kodo fragmentas parodo, kaip tai padaryti:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
Šiame kode pirmiausia sukuriame „ImageAnnotatorClient“ klasės egzempliorių iš „google.cloud.vision“ bibliotekos. Tada nuskaitome vaizdo failą, iš failo turinio sukuriame objektą „Vaizdas“ ir siunčiame jį į Vision API, kad būtų galima aptikti etiketę. API atsakyme yra etikečių komentarų sąrašas, iš kurio išgauname etikečių aprašymus.
Dabar galite iškviesti funkciją „extract_labels“, nurodydami kelią į vaizdo failą, kurį norite analizuoti. Bus pateiktas iš vaizdo ištrauktų etikečių sąrašas.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Tai išves iš vaizdo ištrauktas etiketes.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API naudoja pažangius mašininio mokymosi modelius, kad analizuotų vaizdus ir identifikuotų objektus, scenas ir kitas vaizdines funkcijas. Jis gali tiksliai aptikti daugybę etikečių, todėl tai yra vertingas įrankis įvairioms programoms, pvz., vaizdų klasifikavimui, turinio tvarkymui ir vaizdinei paieškai.
Norėdami programiškai išskirti etiketes iš vaizdų naudodami Python ir Vision API, turite nustatyti Google Cloud projektą, įgalinti Vision API, įdiegti reikiamas Python bibliotekas, autentifikuoti programą ir naudoti Vision API, kad atliktumėte etiketės aptikimą vaizdai. Išskirtos etiketės gali būti naudojamos tolesnei analizei arba vaizdo turinio supratimui pagerinti.
Kiti naujausi klausimai ir atsakymai apie EITC/AI/GVAPI „Google Vision“ API:
- Kokios yra iš anksto nustatytos objektų atpažinimo kategorijos „Google Vision“ API?
- Ar „Google Vision“ API įgalina veido atpažinimą?
- Kaip galima pridėti rodomą tekstą prie paveikslėlio piešiant objektų ribas naudojant funkciją „draw_vertices“?
- Kokie yra „draw.line“ metodo parametrai pateiktame kode ir kaip jie naudojami brėžiant linijas tarp viršūnių reikšmių?
- Kaip pagalvių biblioteka gali būti naudojama objektų kraštams nubrėžti Python?
- Kokia yra funkcijos „draw_vertices“ paskirtis pateiktame kode?
- Kaip „Google Vision“ API gali padėti suprasti figūras ir objektus vaizde?
- Kaip vartotojai gali tyrinėti vizualiai panašius API rekomenduojamus vaizdus?
- Kokie skirtingi elementai pateikiami „Google Vision“ API žiniatinklio aptikimo funkcijos atsakymo objekte?
- Kaip žiniatinklio aptikimo funkcija padeda generuoti įkeltų vaizdų žymas?
Peržiūrėkite daugiau klausimų ir atsakymų EITC/AI/GVAPI Google Vision API