Ak chcete programovo extrahovať štítky z obrázkov pomocou Pythonu a rozhrania Vision API, môžete využiť výkonné možnosti rozhrania Google Cloud Vision API. Vision API poskytuje komplexnú sadu funkcií analýzy obrazu vrátane detekcie štítkov, ktorá vám umožňuje automaticky identifikovať a extrahovať štítky z obrázkov.
Ak chcete začať, budete musieť nastaviť projekt Google Cloud a povoliť rozhranie Vision API. Keď to urobíte, môžete nainštalovať požadované knižnice Pythonu spustením nasledujúceho príkazu:
python pip install google-cloud-vision
Ďalej je potrebné overiť vašu aplikáciu, aby ste získali prístup k Vision API. Môžete to urobiť vytvorením kľúča účtu služby a nastavením premennej prostredia GOOGLE_APPLICATION_CREDENTIALS tak, aby ukazovala na cestu k súboru kľúča. To možno vykonať pomocou nasledujúceho kódu:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Teraz môžete pomocou rozhrania Vision API programovo extrahovať štítky z obrázkov. Nasledujúci útržok kódu ukazuje, ako to urobiť:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
V tomto kóde najprv vytvoríme inštanciu triedy `ImageAnnotatorClient` z knižnice `google.cloud.vision`. Potom prečítame súbor s obrázkom, z obsahu súboru vytvoríme objekt „Image“ a odošleme ho do API Vision na detekciu štítkov. Odpoveď API obsahuje zoznam anotácií štítkov, z ktorých extrahujeme popisy štítkov.
Teraz môžete zavolať funkciu `extrah_labels` zadaním cesty k súboru obrázka, ktorý chcete analyzovať. Vráti zoznam štítkov extrahovaných z obrázka.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Tým sa vytlačia extrahované štítky z obrázka.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API využíva pokročilé modely strojového učenia na analýzu obrázkov a identifikáciu objektov, scén a iných vizuálnych prvkov. Dokáže presne rozpoznať širokú škálu štítkov, čo z neho robí cenný nástroj pre rôzne aplikácie, ako je klasifikácia obrázkov, moderovanie obsahu a vizuálne vyhľadávanie.
Ak chcete programovo extrahovať štítky z obrázkov pomocou Pythonu a rozhrania Vision API, musíte nastaviť projekt Google Cloud, povoliť rozhranie Vision API, nainštalovať požadované knižnice Pythonu, overiť svoju aplikáciu a potom pomocou rozhrania Vision API vykonať detekciu štítkov na snímky. Extrahované štítky možno použiť na ďalšiu analýzu alebo na zlepšenie pochopenia obsahu obrázka.
Ďalšie nedávne otázky a odpovede týkajúce sa EITC/AI/GVAPI Google Vision API:
- Aké sú niektoré preddefinované kategórie na rozpoznávanie objektov v rozhraní Google Vision API?
- Umožňuje Google Vision API rozpoznávanie tváre?
- Ako je možné pridať zobrazovaný text do obrázka pri kreslení hraníc objektu pomocou funkcie „draw_vertices“?
- Aké sú parametre metódy "draw.line" v poskytnutom kóde a ako sa používajú na kreslenie čiar medzi hodnotami vrcholov?
- Ako sa dá knižnica vankúšov použiť na kreslenie hraníc objektov v Pythone?
- Aký je účel funkcie „draw_vertices“ v poskytnutom kóde?
- Ako môže rozhranie Google Vision API pomôcť pochopiť tvary a objekty na obrázku?
- Ako môžu používatelia preskúmať vizuálne podobné obrázky odporúčané rozhraním API?
- Aké sú rôzne prvky poskytované v objekte odpovede funkcie detekcie webu Google Vision API?
- Ako pomáha funkcia Web Detection pri generovaní značiek pre nahrané obrázky?
Pozrite si ďalšie otázky a odpovede v EITC/AI/GVAPI Google Vision API