Za pristup izdvojenom tekstu sa slike pomoću Google Vision API-ja, možete slijediti niz koraka koji uključuju korištenje mogućnosti optičkog prepoznavanja znakova (OCR) API-ja. OCR tehnologija u Google Vision API-ju omogućuje otkrivanje i izdvajanje teksta iz slika, uključujući rukopis. Ova je funkcionalnost posebno korisna u aplikacijama koje zahtijevaju analizu i razumijevanje tekstualnih informacija prisutnih u vizualnim podacima.
Prvo morate postaviti potrebnu okolinu za rad s Google Vision API-jem. To uključuje stvaranje projekta u Google Cloud Consoleu, omogućavanje Vision API-ja i dobivanje potrebnih vjerodajnica za autentifikaciju kao što je API ključ ili ključ računa usluge.
Nakon što je vaše okruženje postavljeno, možete koristiti metodu `asyncBatchAnnotateFiles` Vision API-ja za izvođenje OCR-a na slikovnoj datoteci. Ova metoda omogućuje prosljeđivanje popisa slikovnih datoteka za obradu i primanje rezultata asinkrono. Alternativno, možete koristiti metodu `asyncBatchAnnotateImages` za izravnu obradu popisa slika.
Da biste izvukli tekst iz slike, trebate stvoriti instancu objekta `AnnotateImageRequest` i navesti željene značajke. U ovom slučaju, postavili biste značajku `TEXT_DETECTION` da označite da želite izvući tekst iz slike. Također možete odrediti dodatne parametre kao što je jezični savjet za poboljšanje točnosti OCR-a.
Zatim trebate kodirati slikovnu datoteku u base64 kodirani niz i stvoriti instancu objekta `Slika` pomoću kodiranih slikovnih podataka. Ovaj objekt `Image` treba dodati objektu `AnnotateImageRequest` koji je ranije stvoren.
Nakon što postavite zahtjev, možete ga poslati Vision API-ju pomoću metode `batchAnnotateImages` ili `batchAnnotateFiles`, ovisno o odabranom pristupu. API će obraditi sliku i vratiti odgovor koji sadrži izdvojeni tekst.
Za pristup izdvojenom tekstu iz odgovora, možete iterirati preko polja `textAnnotations` objekta `AnnotateImageResponse`. Ovo polje sadrži popis objekata `EntityAnnotation`, od kojih svaki predstavlja otkriveni tekstualni element na slici. Polje `description` svakog objekta `EntityAnnotation` sadrži izdvojeni tekst.
Ovdje je primjer isječka koda u Pythonu koji pokazuje kako pristupiti ekstrahiranom tekstu sa slike pomoću Google Vision API-ja:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
U ovom primjeru funkcija `extract_text_from_image` uzima putanju do slikovne datoteke kao ulaz i koristi klijentsku biblioteku Google Cloud Vision za slanje zahtjeva Vision API-ju. Izdvojeni tekst se zatim ispisuje.
Da biste pristupili izdvojenom tekstu sa slike pomoću Google Vision API-ja, trebate postaviti okruženje, stvoriti objekt `AnnotateImageRequest` sa željenim značajkama, kodirati datoteku slike, poslati zahtjev API-ju i dohvatiti izdvojeni tekst od odgovora. Mogućnosti OCR-a Vision API-ja omogućuju otkrivanje i izdvajanje teksta iz slika, uključujući rukopis.
Ostala nedavna pitanja i odgovori u vezi Otkrivanje i izdvajanje teksta iz rukopisa:
- Koja ograničenja mogu nastati prilikom izdvajanja teksta iz složenih dokumenata pomoću Google Vision API-ja?
- Kakvo je značenje razina pouzdanosti u tumačenju teksta Google Vision API-ja?
- Kako Google Vision API može točno prepoznati i izdvojiti tekst iz rukom pisanih bilješki?
- Koji su izazovi u otkrivanju i izdvajanju teksta iz rukom pisanih slika?
- Može li Google Vision prepoznati rukopis?