Aké sú kľúčové komponenty konvolučnej neurónovej siete (CNN) a ich príslušné úlohy v úlohách rozpoznávania obrazu?

by Akadémia EITCA / Utorok, 08 2023 augusta / vyšlo v Umelá inteligencia, Hlboké učenie EITC/AI/DLTF s TensorFlow, Konvolučné neurónové siete v TensorFlow, Konvolučné neurónové siete s TensorFlow, Preskúmanie skúšky

Konvolučná neurónová sieť (CNN) je typ modelu hlbokého učenia, ktorý sa široko používa v úlohách rozpoznávania obrázkov. Je špeciálne navrhnutý na efektívne spracovanie a analýzu vizuálnych údajov, čo z neho robí výkonný nástroj v aplikáciách počítačového videnia. V tejto odpovedi budeme diskutovať o kľúčových komponentoch CNN a ich príslušných úlohách v úlohách rozpoznávania obrazu.

1. Konvolučné vrstvy: Konvolučné vrstvy sú stavebnými kameňmi CNN. Pozostávajú zo sady naučiteľných filtrov alebo jadier, ktoré sú spojené so vstupným obrázkom a vytvárajú mapy prvkov. Každý filter deteguje špecifický vzor alebo prvok na obrázku, ako sú okraje, rohy alebo textúry. Operácia konvolúcie zahŕňa posúvanie filtra po obrázku a výpočet bodového súčinu medzi váhami filtra a zodpovedajúcou oblasťou obrázka. Tento proces sa opakuje pre každé miesto na obrázku, čím sa vygeneruje mapa prvkov, ktorá zvýrazňuje prítomnosť rôznych prvkov.

Príklad: Zoberme si filter 3×3, ktorý detekuje vodorovné okraje. Keď sa spojí so vstupným obrázkom, vytvorí sa mapa prvkov, ktorá zdôrazňuje vodorovné okraje obrázka.

2. Združovacie vrstvy: Združovacie vrstvy sa používajú na prevzorkovanie máp prvkov generovaných konvolučnými vrstvami. Zmenšujú priestorové rozmery máp objektov a zároveň zachovávajú najdôležitejšie informácie. Najbežnejšie používaná operácia združovania je max pooling, ktorá vyberá maximálnu hodnotu v rámci združovacieho okna. To pomáha znižovať výpočtovú zložitosť siete a robí ju odolnejšou voči malým priestorovým odchýlkam vo vstupnom obraze.

Príklad: Aplikovaním maximálneho združovania s oknom združovania 2×2 na mape objektov sa vyberie maximálna hodnota v každej neprekrývajúcej sa oblasti 2×2, čím sa efektívne znížia priestorové rozmery na polovicu.

3. Aktivačné funkcie: Aktivačné funkcie zavádzajú do CNN nelinearitu, čo jej umožňuje učiť sa zložité vzorce a robiť predpovede. Najbežnejšie používanou aktivačnou funkciou v CNN je Rectified Linear Unit (ReLU), ktorá počíta výstup ako maximum nuly a vstup. ReLU je preferovaný vďaka svojej jednoduchosti a schopnosti zmierniť problém miznúceho gradientu.

Príklad: Ak je výstup neurónu záporný, ReLU ho nastaví na nulu, čím sa neurón efektívne vypne. Ak je výstup kladný, ReLU ho ponechá nezmenený.

4. Plne prepojené vrstvy: Plne prepojené vrstvy sú zodpovedné za vytváranie konečných predpovedí na základe extrahovaných prvkov. Berú sploštené mapy prvkov z predchádzajúcich vrstiev a prechádzajú cez sériu plne prepojených neurónov. Každý neurón v plne prepojenej vrstve je spojený s každým neurónom v predchádzajúcej vrstve, čo mu umožňuje učiť sa zložité vzťahy medzi funkciami a robiť presné predpovede.

Príklad: V úlohe rozpoznávania obrázkov môže mať plne prepojená vrstva neuróny zodpovedajúce rôznym triedam, ako napríklad „mačka“, „pes“ a „auto“. Výstup plne prepojenej vrstvy možno interpretovať ako pravdepodobnosti vstupného obrazu patriaceho do každej triedy.

5. Stratová funkcia: Stratová funkcia meria nesúlad medzi predpovedanými výstupmi a základnými pravdivostnými štítkami. Kvantifikuje, ako dobre CNN vykonáva danú úlohu a poskytuje signál na aktualizáciu parametrov modelu počas tréningu. Výber funkcie straty závisí od konkrétnej úlohy rozpoznávania obrazu, ako je binárna krížová entropia pre binárnu klasifikáciu alebo kategorická krížová entropia pre klasifikáciu viacerých tried.

Príklad: V úlohe binárnej klasifikácie porovnáva strata binárnej krížovej entropie predpokladanú pravdepodobnosť pozitívnej triedy so skutočným označením (0 alebo 1) a penalizuje veľké rozdiely medzi nimi.

Konvolučná neurónová sieť (CNN) pozostáva z konvolučných vrstiev, združovacích vrstiev, aktivačných funkcií, plne prepojených vrstiev a stratovej funkcie. Konvolučné vrstvy extrahujú zmysluplné prvky zo vstupného obrázka, zatiaľ čo združovacie vrstvy prevzorkujú mapy prvkov. Aktivačné funkcie zavádzajú nelinearitu a plne prepojené vrstvy vytvárajú konečné predpovede. Stratová funkcia meria nesúlad medzi predpovedanými výstupmi a základnými pravdivostnými štítkami a riadi tréningový proces.

Ďalšie nedávne otázky a odpovede týkajúce sa Konvolučné neurónové siete v TensorFlow:

Ďalšie otázky a odpovede:

Označené pod: Umelá inteligencia, CNN, Počítačové videnie, Konvolučná neurónová sieť, Deep Learning, Rozpoznávanie obrázkov

Akadémia EITCA

Aké sú kľúčové komponenty konvolučnej neurónovej siete (CNN) a ich príslušné úlohy v úlohách rozpoznávania obrazu?

Ďalšie nedávne otázky a odpovede týkajúce sa Konvolučné neurónové siete v TensorFlow:

Ďalšie otázky a odpovede:

EITCA Academy je súčasťou európskeho rámca IT certifikácie

Spôsobilosť pre EITCA Academy 80% EITCI DSJC Dotačná podpora

Akadémia EITCA

PRIHLÁSTE SA NA VÁŠ ÚČET PODĽA VÁŠHO UŽÍVATEĽA ALEBO E-mailovej adresy

ZAPALIŤ PODROBNOSTI?

VYTVORIŤ ÚČET

Aké sú kľúčové komponenty konvolučnej neurónovej siete (CNN) a ich príslušné úlohy v úlohách rozpoznávania obrazu?

Ďalšie nedávne otázky a odpovede týkajúce sa Konvolučné neurónové siete v TensorFlow:

Ďalšie otázky a odpovede:

Spôsobilosť pre EITCA Academy 80% EITCI DSJC Dotačná podpora