Kako biste izdvojili sve bilješke objekta iz odgovora API-ja u području umjetne inteligencije – Google Vision API – Napredno razumijevanje slika – Detekcija objekata, možete upotrijebiti format odgovora koji nudi API, a koji uključuje popis otkrivenih objekata zajedno s njihovim odgovarajućim granični okviri i rezultati povjerenja. Raščlanjivanjem ovog odgovora možete izdvojiti željene bilješke objekta.
Odgovor API-ja obično se sastoji od JSON objekta koji sadrži različita polja, uključujući polje "localizedObjectAnnotations", koje sadrži otkrivene objekte. Svaka anotacija objekta uključuje informacije kao što su naziv objekta, njegove koordinate graničnog okvira i rezultat pouzdanosti koji pokazuje povjerenje API-ja u detekciju.
Da biste izdvojili bilješke objekta, možete slijediti ove korake:
1. Raščlanite odgovor API-ja: Počnite analiziranjem JSON odgovora primljenog od API-ja. To se može učiniti pomoću JSON biblioteke za raščlanjivanje ili ugrađenih funkcija koje nudi vaš programski jezik.
2. Pristupite polju "localizedObjectAnnotations": Nakon što se odgovor raščlani, pristupite polju "localizedObjectAnnotations", koje sadrži otkrivene objekte. Ovo polje je obično niz bilješki objekta.
3. Iterirajte kroz bilješke objekta: Iterirajte kroz svaku oznaku objekta u nizu. Svaka napomena predstavlja otkriveni objekt na slici.
4. Izdvojite relevantne informacije: Izdvojite relevantne informacije iz svake oznake objekta, kao što je naziv objekta, koordinate graničnog okvira i rezultat pouzdanosti. Ovim se detaljima može pristupiti kao zasebnim poljima unutar svake oznake objekta.
5. Pohranite ili obradite izdvojene informacije: Ovisno o vašim zahtjevima, možete pohraniti izdvojene informacije u strukturu podataka ili ih dalje obraditi za analizu ili druge svrhe. Na primjer, možda ćete htjeti pohraniti nazive objekata i njihove odgovarajuće koordinate graničnih okvira u bazu podataka ili ih koristiti za daljnje zadatke razumijevanja slike.
Evo pojednostavljenog primjera za ilustraciju procesa ekstrakcije:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"sredina": "/m/01g317",
"ime": "mačka",
"rezultat": 0.89271355,
"boundingPoly": {
"normalizirani vrhovi": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
]}
},
{
"sredina": "/m/04rky",
"ime": "pas",
"rezultat": 0.8132468,
"boundingPoly": {
"normalizirani vrhovi": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
]}
}
]}
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
U ovom primjeru pretpostavljamo JSON odgovor koji sadrži dva otkrivena objekta: mačku i psa. Kod analizira odgovor, pristupa polju "localizedObjectAnnotations", ponavlja svaku oznaku objekta i izdvaja naziv objekta, koordinate graničnog okvira i ocjenu pouzdanosti. Na kraju, izdvojene informacije se ispisuju, ali možete modificirati kod tako da odgovara vašim specifičnim potrebama.
Slijedeći ove korake, možete učinkovito izdvojiti sve bilješke objekta iz odgovora API-ja u polju umjetne inteligencije – Google Vision API – Napredno razumijevanje slika – Otkrivanje objekata.
Ostala nedavna pitanja i odgovori u vezi Napredno razumijevanje slika:
- Koje su unaprijed definirane kategorije za prepoznavanje objekata u Google Vision API-ju?
- Koji je preporučeni pristup za korištenje značajke otkrivanja sigurnog pretraživanja u kombinaciji s drugim tehnikama moderiranja?
- Kako možemo pristupiti i prikazati vrijednosti vjerojatnosti za svaku kategoriju u napomeni sigurnog pretraživanja?
- Kako možemo dobiti napomenu o sigurnom pretraživanju koristeći Google Vision API u Pythonu?
- Kojih je pet kategorija uključeno u značajku otkrivanja sigurnog pretraživanja?
- Kako značajka sigurnog pretraživanja Google Vision API-ja otkriva eksplicitan sadržaj unutar slika?
- Kako možemo vizualno identificirati i istaknuti otkrivene objekte na slici pomoću knjižnice jastuka?
- Kako možemo organizirati ekstrahirane informacije o objektu u tabelarnom formatu koristeći podatkovni okvir pandas?
- Koje se biblioteke i programski jezik koriste za demonstraciju funkcionalnosti Google Vision API-ja?
- Kako Google Vision API izvodi otkrivanje objekata i lokalizaciju u slikama?
Više pitanja i odgovora pogledajte u Naprednom razumijevanju slika