Cloud Machine Learning Engine (CMLE) je výkonný nástroj poskytovaný platformou Google Cloud Platform (GCP) na trénovanie modelov strojového učenia distribuovaným a paralelným spôsobom. Neponúka však automatické získavanie a konfiguráciu zdrojov, ani nerieši vypnutie zdrojov po ukončení trénovania modelu. V tejto odpovedi sa ponoríme do detailov CMLE, jeho schopností a potreby manuálnej správy zdrojov.
CMLE je navrhnutý tak, aby zjednodušil proces školenia a nasadzovania modelov strojového učenia vo veľkom rozsahu. Poskytuje spravované prostredie, ktoré umožňuje používateľom sústrediť sa skôr na vývoj modelov než na správu infraštruktúry. CMLE využíva silu infraštruktúry GCP na distribúciu tréningovej záťaže na viacero počítačov, čo umožňuje rýchlejšie tréningové časy a spracovanie veľkých súborov údajov.
Pri používaní CMLE majú používatelia flexibilitu pri výbere typu a počtu zdrojov požadovaných pre ich tréningovú prácu. Môžu si vybrať typ stroja, počet pracovníkov a ďalšie parametre na základe svojich špecifických požiadaviek. CMLE však tieto prostriedky nezískava a nekonfiguruje automaticky. Je na zodpovednosti užívateľa, aby si pred začatím tréningu zabezpečil potrebné zdroje.
Na získanie zdrojov môžu používatelia využívať služby GCP, ako je Compute Engine alebo Kubernetes Engine. Tieto služby poskytujú škálovateľnú a flexibilnú infraštruktúru na prispôsobenie sa školiacemu pracovnému zaťaženiu. Používatelia môžu vytvárať inštancie virtuálnych strojov alebo kontajnery, konfigurovať ich s požadovanými softvérovými závislosťami a potom ich používať ako pracovníkov v CMLE.
Po dokončení úlohy školenia CMLE automaticky nevypne zdroje používané na školenie. Je to preto, že trénovaný model môže byť potrebné nasadiť a slúžiť na účely odvodzovania. Je na užívateľovi, aby sa rozhodol, kedy a ako zdroje ukončí, aby sa predišlo zbytočným nákladom.
Aby som to zhrnul, CMLE ponúka výkonnú platformu na trénovanie modelu paralelného strojového učenia. Vyžaduje však ručné získavanie a konfiguráciu zdrojov a nerieši vypnutie zdrojov po ukončení školenia. Používatelia musia poskytovať potrebné zdroje pomocou služieb GCP, ako sú Compute Engine alebo Kubernetes Engine, a spravovať svoj životný cyklus na základe svojich špecifických požiadaviek.
Ďalšie nedávne otázky a odpovede týkajúce sa Pokrok v strojovom učení:
- Aké sú obmedzenia pri práci s veľkými množinami údajov v rámci strojového učenia?
- Môže strojové učenie pomôcť pri dialógu?
- Čo je ihrisko TensorFlow?
- Bráni dychový režim distribuovanej výpočtovej funkcii TensorFlow?
- Dajú sa cloudové riešenia Google použiť na oddelenie výpočtovej techniky od úložiska pre efektívnejšie trénovanie modelu ML s veľkými dátami?
- Je možné trénovať modely strojového učenia na ľubovoľne veľkých súboroch údajov bez štikútania?
- Vyžaduje si pri použití CMLE vytvorenie verzie špecifikáciu zdroja exportovaného modelu?
- Môže CMLE čítať údaje z úložiska Google Cloud a použiť určený model na odvodenie?
- Môže byť Tensorflow použitý na tréning a odvodenie hlbokých neurónových sietí (DNN)?
- Čo je to algoritmus zosilnenia gradientu?
Ďalšie otázky a odpovede nájdete v časti Pokrok v strojovom učení