AutoML Tables je výkonný nástroj strojového učenia poskytovaný službou Google Cloud, ktorý používateľom umožňuje vytvárať a nasadzovať modely strojového učenia bez potreby rozsiahlych odborných znalostí v oblasti programovania alebo vedy o údajoch. Automatizuje proces inžinierstva funkcií, výberu modelu, ladenia hyperparametrov a vyhodnocovania modelov, vďaka čomu je prístupný používateľom s rôznou úrovňou znalostí strojového učenia.
Pokiaľ ide o typy údajov, tabuľky AutoML dokážu spracovať širokú škálu štruktúrovaných typov údajov. Štruktúrované údaje sa týkajú údajov, ktoré sú usporiadané v tabuľkovom formáte, pričom riadky predstavujú inštancie alebo príklady a stĺpce predstavujú funkcie alebo premenné. Tabuľky AutoML dokážu spracovať numerické aj kategorické typy údajov, čo používateľom umožňuje pracovať s rôznymi množinami údajov.
1. Číselné údaje: Tabuľky AutoML podporujú rôzne typy číselných údajov vrátane celých čísel a čísel s pohyblivou rádovou čiarkou. Tieto dátové typy sú vhodné na reprezentáciu spojitých alebo diskrétnych číselných hodnôt. Napríklad, ak máme súbor údajov o cenách nehnuteľností, stĺpec ceny bude reprezentovaný ako číselný typ údajov.
2. Kategorické údaje: Tabuľky AutoML tiež podporujú kategorické typy údajov, ktoré predstavujú diskrétne hodnoty, ktoré spadajú do špecifických kategórií. Kategorické údaje možno ďalej rozdeliť na dva podtypy:
a. Nominálne údaje: Nominálne údaje predstavujú kategórie, ktoré nemajú žiadne vlastné poradie alebo hierarchiu. Ak máme napríklad súbor údajov spätnej väzby od zákazníkov, stĺpec sentimentu môže obsahovať kategórie ako „pozitívny“, „neutrálny“ a „negatívny“. Tabuľky AutoML dokážu spracovať takéto nominálne kategorické údaje.
b. Ordinálne dáta: Ordinálne dáta predstavujú kategórie, ktoré majú špecifické poradie alebo hierarchiu. Ak máme napríklad súbor údajov hodnotení filmov, stĺpec hodnotenia môže obsahovať kategórie ako „slabé“, „spravodlivé“, „dobré“ a „vynikajúce“. Tabuľky AutoML dokážu spracovať takéto ordinálne kategorické údaje a zohľadňovať poradie kategórií počas modelovania.
3. Textové údaje: Tabuľky AutoML tiež poskytujú podporu pre textové údaje. Textové údaje sú zvyčajne neštruktúrované a na ich konverziu do štruktúrovaného formátu vhodného pre strojové učenie si vyžadujú predbežné spracovanie. Tabuľky AutoML dokážu spracovať textové údaje pomocou techník, ako je vkladanie textu alebo reprezentácia vreca slov. Napríklad, ak máme súbor údajov recenzií zákazníkov, text recenzie možno transformovať na numerické prvky pomocou techník, ako je vkladanie slov, ktoré potom môžu použiť tabuľky AutoML na trénovanie modelov.
4. Údaje o časových radoch: Tabuľky AutoML dokážu spracovať údaje časových radov, čo sú údaje zhromaždené v sekvencii časových intervalov. Údaje o časových radoch sa bežne vyskytujú v rôznych oblastiach, ako sú financie, predpoveď počasia a analýza akciového trhu. Tabuľky AutoML dokážu spracovať údaje časových radov začlenením funkcií súvisiacich s časom, ako sú časové pečiatky a oneskorené premenné.
Tabuľky AutoML dokážu spracovať širokú škálu typov štruktúrovaných údajov vrátane číselných, kategorických (nominálnych aj ordinálnych), textových údajov a údajov časových radov. Táto všestrannosť umožňuje používateľom využiť výkon tabuliek AutoML pre rôznorodú sadu úloh strojového učenia v rôznych doménach.
Ďalšie nedávne otázky a odpovede týkajúce sa Tabuľky AutoML:
- Ako je možné prechádzať medzi tabuľkami Vertex AI a AutoML?
- Prečo boli tabuľky AutoML prerušené a čo ich nasleduje?
- Ako môžu používatelia nasadiť svoj model a získať predpovede v tabuľkách AutoML?
- Aké možnosti sú k dispozícii na nastavenie rozpočtu školenia v tabuľkách AutoML?
- Aké informácie poskytuje karta Analýza v tabuľkách AutoML?
- Ako môžu používatelia importovať svoje tréningové údaje do tabuliek AutoML?