Za programsko izdvajanje oznaka iz slika pomoću Pythona i Vision API-ja, možete iskoristiti moćne mogućnosti Google Cloud Vision API-ja. Vision API pruža sveobuhvatan skup značajki analize slike, uključujući otkrivanje oznaka, koje vam omogućuje automatsko prepoznavanje i izdvajanje oznaka iz slika.
Za početak ćete morati postaviti Google Cloud projekt i omogućiti Vision API. Nakon što to učinite, možete instalirati potrebne Python biblioteke pokretanjem sljedeće naredbe:
python pip install google-cloud-vision
Zatim morate potvrditi autentičnost svoje aplikacije za pristup Vision API-ju. To možete učiniti stvaranjem ključa računa usluge i postavljanjem varijable okruženja `GOOGLE_APPLICATION_CREDENTIALS` da pokazuje na putanju datoteke ključa. To se može učiniti pomoću sljedećeg koda:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Sada možete koristiti Vision API za programsko izdvajanje oznaka iz slika. Sljedeći isječak koda pokazuje kako se to radi:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
U ovom kodu prvo stvaramo instancu klase `ImageAnnotatorClient` iz biblioteke `google.cloud.vision`. Zatim čitamo slikovnu datoteku, stvaramo objekt "Slika" iz sadržaja datoteke i šaljemo ga Vision API-ju za otkrivanje oznake. Odgovor API-ja sadrži popis zabilješki oznaka iz kojih izvlačimo opise oznaka.
Sada možete pozvati funkciju `extract_labels` prosljeđivanjem putanje do slikovne datoteke koju želite analizirati. Vratit će popis oznaka izdvojenih iz slike.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Ovo će ispisati izdvojene oznake sa slike.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API koristi napredne modele strojnog učenja za analizu slika i prepoznavanje objekata, scena i drugih vizualnih značajki. Može točno otkriti širok raspon oznaka, što ga čini vrijednim alatom za različite primjene kao što su klasifikacija slika, moderiranje sadržaja i vizualno pretraživanje.
Da biste programski izvukli oznake iz slika pomoću Pythona i Vision API-ja, trebate postaviti Google Cloud projekt, omogućiti Vision API, instalirati potrebne Python biblioteke, potvrditi autentičnost svoje aplikacije, a zatim upotrijebiti Vision API za izvođenje detekcije oznaka na slike. Izdvojene oznake mogu se koristiti za daljnju analizu ili za poboljšanje razumijevanja sadržaja slike.
Ostala nedavna pitanja i odgovori u vezi EITC/AI/GVAPI Google Vision API:
- Koje su unaprijed definirane kategorije za prepoznavanje objekata u Google Vision API-ju?
- Omogućuje li Google Vision API prepoznavanje lica?
- Kako se prikazni tekst može dodati slici prilikom crtanja granica objekta pomoću funkcije "draw_vertices"?
- Koji su parametri metode "draw.line" u danom kodu i kako se koriste za crtanje linija između vrijednosti vrhova?
- Kako se knjižnica jastuka može koristiti za crtanje granica objekta u Pythonu?
- Koja je svrha funkcije "draw_vertices" u navedenom kodu?
- Kako Google Vision API može pomoći u razumijevanju oblika i objekata na slici?
- Kako korisnici mogu istražiti vizualno slične slike koje preporučuje API?
- Koji su različiti elementi navedeni u objektu odgovora značajke otkrivanja weba Google Vision API-ja?
- Kako značajka web detekcije pomaže u generiranju oznaka za učitane slike?
Pogledajte više pitanja i odgovora u EITC/AI/GVAPI Google Vision API