Označené údaje v kontexte umelej inteligencie (AI) a konkrétne v doméne Google Cloud Machine Learning označujú množinu údajov, ktorá bola anotovaná alebo označená konkrétnymi štítkami alebo kategóriami. Tieto označenia slúžia ako základná pravda alebo referencia pre trénovanie algoritmov strojového učenia. Priradením údajových bodov k ich zodpovedajúcim štítkom sa model strojového učenia môže naučiť rozpoznávať vzory a vytvárať predpovede na základe nových, neviditeľných údajov.
Označené údaje zohrávajú kľúčovú úlohu pri učení pod dohľadom, čo je bežný prístup v strojovom učení. Pri učení pod dohľadom sa model trénuje na označenom súbore údajov, aby sa naučil vzťah medzi vstupnými funkciami a ich zodpovedajúcimi výstupnými označeniami. Tento tréningový proces umožňuje modelu zovšeobecniť svoje znalosti a robiť presné predpovede na nových, neviditeľných údajoch.
Na ilustráciu tohto konceptu uvažujme o príklade úlohy strojového učenia v oblasti rozpoznávania obrazu. Predpokladajme, že chceme vytvoriť model, ktorý dokáže klasifikovať obrázky zvierat do rôznych kategórií, ako sú mačky, psy a vtáky. Potrebovali by sme označenú množinu údajov, kde by bol každý obrázok spojený so správnym označením. Napríklad obrázok mačky by bol označený ako „mačka“, obrázok psa ako „pes“ atď.
Označený súbor údajov by pozostával z kolekcie obrázkov a ich zodpovedajúcich označení. Každý obrázok by bol reprezentovaný súborom funkcií, ako sú hodnoty pixelov alebo reprezentácie vyššej úrovne extrahované z obrázka. Štítky by označovali správnu kategóriu alebo triedu, do ktorej každý obrázok patrí.
Počas tréningovej fázy bude model strojového učenia prezentovaný s označeným súborom údajov. Naučilo by sa identifikovať vzory a vzťahy medzi vstupnými funkciami a zodpovedajúcimi označeniami. Model by aktualizoval svoje interné parametre, aby sa minimalizoval rozdiel medzi jeho predpoveďami a skutočnými štítkami v trénovacích údajoch.
Keď je model natrénovaný, možno ho použiť na predpovede na nových, neviditeľných obrázkoch. Vzhľadom na neoznačený obrázok by model analyzoval jeho vlastnosti a predpovedal najpravdepodobnejšie označenie na základe svojich vedomostí z označeného súboru údajov. Ak napríklad model predpovedá, že obrázok obsahuje mačku, znamená to, že na obrázku rozpoznal vzory, ktoré svedčia o mačke.
Označené údaje sú základnou súčasťou tréningových modelov strojového učenia. Poskytuje potrebné informácie, z ktorých sa model môže učiť a robiť presné predpovede. Priradením údajových bodov k ich zodpovedajúcim označeniam sa model môže naučiť rozpoznávať vzory a zovšeobecňovať svoje znalosti na neviditeľné údaje.
Ďalšie nedávne otázky a odpovede týkajúce sa EITC/AI/GCML Google Cloud Machine Learning:
- Čo je prevod textu na reč (TTS) a ako funguje s AI?
- Aké sú obmedzenia pri práci s veľkými množinami údajov v rámci strojového učenia?
- Môže strojové učenie pomôcť pri dialógu?
- Čo je ihrisko TensorFlow?
- Čo vlastne znamená väčší súbor údajov?
- Aké sú niektoré príklady hyperparametrov algoritmu?
- Čo je to súborové učenie?
- Čo ak vybraný algoritmus strojového učenia nie je vhodný a ako sa možno uistiť, že vyberiete ten správny?
- Potrebuje model strojového učenia počas tréningu dohľad?
- Aké sú kľúčové parametre používané v algoritmoch založených na neurónových sieťach?
Ďalšie otázky a odpovede nájdete v EITC/AI/GCML Google Cloud Machine Learning