Učenie pod dohľadom a učenie bez dozoru sú dva základné typy paradigiem strojového učenia, ktoré slúžia na odlišné účely na základe povahy údajov a cieľov danej úlohy. Pri navrhovaní efektívnych modelov strojového učenia je kľúčové pochopiť, kedy použiť školenie pod dohľadom verzus školenie bez dozoru. Výber medzi týmito dvoma prístupmi závisí od dostupnosti označených údajov, požadovaného výsledku a základnej štruktúry súboru údajov.
Učenie pod dohľadom je typ strojového učenia, pri ktorom sa model trénuje na označenom súbore údajov. Pri učení pod dohľadom sa algoritmus učí mapovať vstupné údaje na správny výstup tak, že sa mu prezentujú príklady školenia. Tieto tréningové príklady pozostávajú zo vstupno-výstupných párov, kde sú vstupné dáta sprevádzané zodpovedajúcim správnym výstupom alebo cieľovou hodnotou. Cieľom kontrolovaného učenia je naučiť sa mapovaciu funkciu zo vstupných premenných na výstupné premenné, ktoré sa potom môžu použiť na predpovedanie neviditeľných údajov.
Učenie pod dohľadom sa zvyčajne používa, keď je známy požadovaný výstup a cieľom je naučiť sa vzťah medzi vstupnými a výstupnými premennými. Bežne sa používa v úlohách, ako je klasifikácia, kde je cieľom predpovedať označenie tried nových inštancií, a regresia, kde je cieľom predpovedať spojitú hodnotu. Napríklad v scenári učenia pod dohľadom môžete trénovať model na predpovedanie, či je e-mail spam alebo nie, na základe obsahu e-mailu a stavu predchádzajúcich e-mailov označených ako spam/nevyžiadaná pošta.
Na druhej strane, učenie bez dozoru je typ strojového učenia, kde sa model trénuje na neoznačenom súbore údajov. Pri učení bez dozoru sa algoritmus učí vzory a štruktúry zo vstupných údajov bez explicitnej spätnej väzby na správny výstup. Cieľom učenia bez dozoru je preskúmať základnú štruktúru údajov, objaviť skryté vzorce a extrahovať zmysluplné poznatky bez potreby označených údajov.
Učenie bez dozoru sa bežne používa, keď je cieľom preskúmať údaje, nájsť skryté vzory a zoskupiť podobné údajové body. Často sa používa v úlohách, ako je klastrovanie, kde je cieľom zoskupiť podobné údajové body do zhlukov na základe ich vlastností, a redukcia rozmerov, kde je cieľom znížiť počet prvkov pri zachovaní základných informácií v údajoch. Napríklad v scenári učenia bez dozoru môžete použiť klastrovanie na zoskupenie zákazníkov na základe ich nákupného správania bez predchádzajúcej znalosti segmentov zákazníkov.
Výber medzi učením pod dohľadom a učením bez dozoru závisí od viacerých faktorov. Ak máte označený súbor údajov a chcete predpovedať konkrétne výsledky, učenie pod dohľadom je vhodnou voľbou. Na druhej strane, ak máte neoznačený súbor údajov a chcete preskúmať štruktúru údajov alebo nájsť skryté vzorce, učenie bez dozoru je vhodnejšie. V niektorých prípadoch možno na využitie výhod oboch prístupov použiť kombináciu techník pod dohľadom aj bez dozoru, známych ako učenie s čiastočným dohľadom.
Rozhodnutie použiť školenie pod dohľadom verzus školenie bez dozoru v strojovom učení závisí od dostupnosti označených údajov, povahy úlohy a požadovaného výsledku. Pochopenie rozdielov medzi učením pod dohľadom a učením bez dozoru je nevyhnutné pre navrhovanie efektívnych modelov strojového učenia, ktoré dokážu získať zmysluplné poznatky a robiť presné predpovede z údajov.
Ďalšie nedávne otázky a odpovede týkajúce sa EITC/AI/GCML Google Cloud Machine Learning:
- Čo je prevod textu na reč (TTS) a ako funguje s AI?
- Aké sú obmedzenia pri práci s veľkými množinami údajov v rámci strojového učenia?
- Môže strojové učenie pomôcť pri dialógu?
- Čo je ihrisko TensorFlow?
- Čo vlastne znamená väčší súbor údajov?
- Aké sú niektoré príklady hyperparametrov algoritmu?
- Čo je to súborové učenie?
- Čo ak vybraný algoritmus strojového učenia nie je vhodný a ako sa možno uistiť, že vyberiete ten správny?
- Potrebuje model strojového učenia počas tréningu dohľad?
- Aké sú kľúčové parametre používané v algoritmoch založených na neurónových sieťach?
Ďalšie otázky a odpovede nájdete v EITC/AI/GCML Google Cloud Machine Learning