Ak chcete extrahovať všetky anotácie objektov z odozvy API v oblasti umelej inteligencie – Google Vision API – Pokročilé chápanie obrázkov – Detekcia objektov, môžete použiť formát odpovede poskytovaný rozhraním API, ktorý obsahuje zoznam zistených objektov spolu s ich zodpovedajúcimi ohraničujúce rámčeky a skóre dôvery. Analýzou tejto odpovede môžete extrahovať anotácie požadovaného objektu.
Odpoveď API zvyčajne pozostáva z objektu JSON obsahujúceho rôzne polia vrátane poľa „localizedObjectAnnotations“, ktoré obsahuje zistené objekty. Každá anotácia objektu obsahuje informácie, ako je názov objektu, jeho súradnice ohraničujúceho rámčeka a skóre spoľahlivosti označujúce dôveru API v detekciu.
Ak chcete extrahovať anotácie objektu, môžete postupovať podľa týchto krokov:
1. Analyzujte odpoveď API: Začnite analýzou odpovede JSON prijatej z API. Môžete to urobiť pomocou knižnice analýzy JSON alebo vstavaných funkcií, ktoré poskytuje váš programovací jazyk.
2. Prejdite do poľa „localizedObjectAnnotations“: Po analýze odpovede prejdite do poľa „localizedObjectAnnotations“, ktoré obsahuje zistené objekty. Toto pole je zvyčajne pole anotácií objektov.
3. Iterujte cez anotácie objektu: Iterujte cez každú anotáciu objektu v poli. Každá poznámka predstavuje detekovaný objekt na obrázku.
4. Extrahujte relevantné informácie: Extrahujte relevantné informácie z každej anotácie objektu, ako je názov objektu, súradnice ohraničujúceho rámčeka a skóre spoľahlivosti. Tieto podrobnosti sú prístupné ako samostatné polia v rámci každej anotácie objektu.
5. Uložte alebo spracujte extrahované informácie: V závislosti od vašich požiadaviek môžete extrahované informácie uložiť do dátovej štruktúry alebo ich ďalej spracovať na analýzu alebo iné účely. Môžete napríklad chcieť uložiť názvy objektov a ich zodpovedajúce súradnice ohraničovacieho rámčeka do databázy alebo ich použiť na ďalšie úlohy porozumenia obrázku.
Tu je zjednodušený príklad na ilustráciu procesu extrakcie:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"mid": "/m/01g317",
"name": "mačka",
"skóre": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
]}
},
{
"mid": "/m/04rky",
"name": "pes",
"skóre": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
]}
}
]}
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
V tomto príklade predpokladáme odpoveď JSON obsahujúcu dva zistené objekty: mačku a psa. Kód analyzuje odpoveď, vstúpi do poľa „localizedObjectAnnotations“, iteruje cez každú anotáciu objektu a extrahuje názov objektu, súradnice ohraničujúceho rámčeka a skóre spoľahlivosti. Nakoniec sa extrahované informácie vytlačia, ale kód môžete upraviť tak, aby vyhovoval vašim špecifickým potrebám.
Nasledovaním týchto krokov môžete efektívne extrahovať všetky anotácie objektov z odozvy API v oblasti umelej inteligencie – Google Vision API – pokročilého chápania obrázkov – detekcie objektov.
Ďalšie nedávne otázky a odpovede týkajúce sa Pokročilé porozumenie obrázkov:
- Aké sú niektoré preddefinované kategórie na rozpoznávanie objektov v rozhraní Google Vision API?
- Aký je odporúčaný prístup na používanie funkcie detekcie bezpečného vyhľadávania v kombinácii s inými technikami moderovania?
- Ako môžeme získať a zobraziť hodnoty pravdepodobnosti pre každú kategóriu v anotácii bezpečného vyhľadávania?
- Ako môžeme získať anotáciu bezpečného vyhľadávania pomocou Google Vision API v Pythone?
- Akých päť kategórií zahŕňa funkcia detekcie bezpečného vyhľadávania?
- Ako rozpozná funkcia bezpečného vyhľadávania Google Vision API explicitný obsah v obrázkoch?
- Ako môžeme vizuálne identifikovať a zvýrazniť detekované objekty na obrázku pomocou knižnice vankúšov?
- Ako môžeme usporiadať extrahované informácie o objekte do tabuľkového formátu pomocou dátového rámca pandy?
- Aké knižnice a programovací jazyk sa používajú na demonštráciu funkčnosti rozhrania Google Vision API?
- Ako rozhranie Google Vision API vykonáva detekciu a lokalizáciu objektov v obrázkoch?
Pozrite si ďalšie otázky a odpovede v časti Rozšírené porozumenie obrázkov