Cloud Machine Learning Engine (CMLE) je výkonný nástroj poskytovaný platformou Google Cloud Platform (GCP) na trénovanie modelov strojového učenia distribuovaným a paralelným spôsobom. Neponúka však automatické získavanie a konfiguráciu zdrojov, ani nerieši vypnutie zdrojov po ukončení trénovania modelu. V tejto odpovedi zvážime detaily CMLE, jeho možnosti a potrebu manuálneho riadenia zdrojov.
CMLE je navrhnutý tak, aby zjednodušil proces školenia a nasadzovania modelov strojového učenia vo veľkom rozsahu. Poskytuje spravované prostredie, ktoré umožňuje používateľom sústrediť sa skôr na vývoj modelov než na správu infraštruktúry. CMLE využíva silu infraštruktúry GCP na distribúciu tréningovej záťaže na viacero počítačov, čo umožňuje rýchlejšie tréningové časy a spracovanie veľkých súborov údajov.
Pri používaní CMLE majú používatelia flexibilitu pri výbere typu a počtu zdrojov požadovaných pre ich tréningovú prácu. Môžu si vybrať typ stroja, počet pracovníkov a ďalšie parametre na základe svojich špecifických požiadaviek. CMLE však tieto prostriedky nezískava a nekonfiguruje automaticky. Je na zodpovednosti užívateľa, aby si pred začatím tréningu zabezpečil potrebné zdroje.
Na získanie zdrojov môžu používatelia využívať služby GCP, ako je Compute Engine alebo Kubernetes Engine. Tieto služby poskytujú škálovateľnú a flexibilnú infraštruktúru na prispôsobenie sa školiacemu pracovnému zaťaženiu. Používatelia môžu vytvárať inštancie virtuálnych strojov alebo kontajnery, konfigurovať ich s požadovanými softvérovými závislosťami a potom ich používať ako pracovníkov v CMLE.
Po dokončení úlohy školenia CMLE automaticky nevypne zdroje používané na školenie. Je to preto, že trénovaný model môže byť potrebné nasadiť a slúžiť na účely odvodzovania. Je na užívateľovi, aby sa rozhodol, kedy a ako zdroje ukončí, aby sa predišlo zbytočným nákladom.
Aby som to zhrnul, CMLE ponúka výkonnú platformu na trénovanie modelu paralelného strojového učenia. Vyžaduje však ručné získavanie a konfiguráciu zdrojov a nerieši vypnutie zdrojov po ukončení školenia. Používatelia musia poskytovať potrebné zdroje pomocou služieb GCP, ako sú Compute Engine alebo Kubernetes Engine, a spravovať svoj životný cyklus na základe svojich špecifických požiadaviek.
Ďalšie nedávne otázky a odpovede týkajúce sa Pokrok v strojovom učení:
- Je možné použiť Kaggle na nahrávanie finančných údajov a vykonávanie štatistických analýz a prognóz pomocou ekonometrických modelov, ako sú R-squared, ARIMA alebo GARCH?
- Keď je jadro rozvetvené s údajmi a originál je súkromný, môže byť rozvetvené jadro verejné, a ak áno, nejde o porušenie súkromia?
- Aké sú obmedzenia pri práci s veľkými množinami údajov v rámci strojového učenia?
- Môže strojové učenie pomôcť pri dialógu?
- Čo je ihrisko TensorFlow?
- Bráni dychový režim distribuovanej výpočtovej funkcii TensorFlow?
- Dajú sa cloudové riešenia Google použiť na oddelenie výpočtovej techniky od úložiska pre efektívnejšie trénovanie modelu ML s veľkými dátami?
- Je možné trénovať modely strojového učenia na ľubovoľne veľkých súboroch údajov bez štikútania?
- Vyžaduje si pri použití CMLE vytvorenie verzie špecifikáciu zdroja exportovaného modelu?
- Môže CMLE čítať údaje z úložiska Google Cloud a použiť určený model na odvodenie?
Ďalšie otázky a odpovede nájdete v časti Pokrok v strojovom učení