Proces trénovania modelu strojového učenia zahŕňa jeho vystavenie obrovskému množstvu údajov, ktoré mu umožnia naučiť sa vzorce a robiť predpovede alebo rozhodnutia bez toho, aby boli explicitne naprogramované pre každý scenár. Počas tréningovej fázy model strojového učenia prechádza sériou iterácií, kde upravuje svoje interné parametre, aby minimalizoval chyby a zlepšil svoj výkon pri danej úlohe.
Dohľad počas tréningu sa týka úrovne ľudského zásahu, ktorý je potrebný na vedenie procesu učenia sa modelu. Potreba dohľadu sa môže líšiť v závislosti od typu použitého algoritmu strojového učenia, zložitosti úlohy a kvality údajov poskytovaných na školenie.
Pri kontrolovanom učení, čo je typ strojového učenia, kde sa model trénuje na označených údajoch, je dohľad nevyhnutný. Označené dáta znamenajú, že každý vstupný dátový bod je spárovaný so správnym výstupom, čo umožňuje modelu naučiť sa mapovanie medzi vstupmi a výstupmi. Počas tréningu pod dohľadom je potrebný ľudský dohľad, aby poskytol správne označenia pre tréningové dáta, vyhodnotil predpovede modelu a upravil parametre modelu na základe spätnej väzby.
Napríklad pri úlohe rozpoznávania obrázkov pod dohľadom, ak je cieľom trénovať model na klasifikáciu obrázkov mačiek a psov, ľudský dozor bude musieť označiť každý obrázok ako mačku alebo psa. Model by sa potom naučil z týchto označených príkladov robiť predpovede na nových, neviditeľných obrázkoch. Supervízor vyhodnotí predpovede modelu a poskytne spätnú väzbu na zlepšenie jeho presnosti.
Na druhej strane, algoritmy učenia bez dozoru nevyžadujú na trénovanie označené údaje. Tieto algoritmy sa učia vzory a štruktúry zo vstupných údajov bez explicitného vedenia. Učenie bez dozoru sa často používa na úlohy, ako je zhlukovanie, detekcia anomálií a redukcia rozmerov. Pri učení bez dozoru sa stroj môže učiť samostatne bez potreby ľudského dohľadu počas tréningu.
Semi-supervised learning je hybridný prístup, ktorý kombinuje prvky učenia pod dohľadom aj bez dozoru. V tomto prístupe je model trénovaný na kombinácii označených a neoznačených údajov. Označené údaje poskytujú určitý dohľad na vedenie procesu učenia, zatiaľ čo neoznačené údaje umožňujú modelu objaviť ďalšie vzory a vzťahy v údajoch.
Posilňovacie učenie je ďalšou paradigmou strojového učenia, kde sa agent učí robiť postupné rozhodnutia prostredníctvom interakcie s prostredím. Pri posilňovaní získava agent spätnú väzbu vo forme odmien alebo pokút na základe svojich činov. Agent sa učí maximalizovať svoju kumulatívnu odmenu v priebehu času prostredníctvom pokusov a omylov. Zatiaľ čo posilňovacie vzdelávanie nevyžaduje explicitný dohľad v tradičnom zmysle, môže byť potrebný ľudský dohľad na navrhnutie štruktúry odmeňovania, stanovenie cieľov vzdelávania alebo doladenie procesu učenia.
Potreba dohľadu počas tréningu strojového učenia závisí od použitej paradigmy učenia, dostupnosti označených údajov a zložitosti úlohy. Učenie pod dohľadom vyžaduje ľudský dohľad, ktorý poskytne označené údaje a vyhodnotí výkon modelu. Učenie bez dozoru nevyžaduje dohľad, pretože model sa učí nezávisle od neoznačených údajov. Učenie sa čiastočne pod dohľadom kombinuje prvky učenia pod dohľadom aj bez dozoru, zatiaľ čo učenie sa posilňovaním zahŕňa učenie sa prostredníctvom interakcie s prostredím.
Ďalšie nedávne otázky a odpovede týkajúce sa EITC/AI/GCML Google Cloud Machine Learning:
- Čo je prevod textu na reč (TTS) a ako funguje s AI?
- Aké sú obmedzenia pri práci s veľkými množinami údajov v rámci strojového učenia?
- Môže strojové učenie pomôcť pri dialógu?
- Čo je ihrisko TensorFlow?
- Čo vlastne znamená väčší súbor údajov?
- Aké sú niektoré príklady hyperparametrov algoritmu?
- Čo je to súborové učenie?
- Čo ak vybraný algoritmus strojového učenia nie je vhodný a ako sa možno uistiť, že vyberiete ten správny?
- Aké sú kľúčové parametre používané v algoritmoch založených na neurónových sieťach?
- Čo je TensorBoard?
Ďalšie otázky a odpovede nájdete v EITC/AI/GCML Google Cloud Machine Learning